Procesamiento de los textos

En todas las obras lexicográficas consideradas en este corpus, sobre todo en las más antiguas, se realizaron diferentes cambios, tanto en los textos escritos en mapudungún como en los escritos en español. Con respecto a los primeros, se realizaron tres grandes modificaciones: la primera de ellas, la normalización de su ortografía. Para ello se utilizó, en términos generales, el Alfabeto Mapuche Unificado (AMU), sobre el que se realizaron dos cambios: uno relativo a la representación de los fonemas interdentales <t>, <n> y <l> y otro relacionado con la escritura de la lateral dentoalveolar (<l>) en ciertos contextos. En el primer caso se adoptó la propuesta de Zúñiga (2010), quien utiliza un apóstrofo pospuesto en la representación de esta serie (<t'>, <n'> y <l'>). Tal elección se debió a que coincidimos con él en creer que "tanto el uso predominante del subrayado en lenguas escritas con el alfabeto latino como los estándares de internet (donde aún es muy frecuente que los enlaces aparezcan en letra de otro color y subrayados) se oponen a la elección de los grafemas <t>, <n> y <l> para la representación de la serie dental como lo sugiere el AMU" (Zúñiga, 2010, p. 272). En el segundo caso se adoptó el uso del guión para separar dos laterales dentoalveolares sucesivas (<l-l>) en contextos donde podría ser confundida con la lateral alveopalatal, muchas veces con consecuencias en el significado de las palabras; por ejemplo, p. e., elul-lafiñ 'no se lo di en su beneficio' vs. elullafiñ 'se lo daré y veré qué ocurre' (Zúñiga, 2010, p. 269).

En la tabla de la derecha se presenta el inventario de fonemas del mapudungún con sus respectivos alófonos y las grafías utilizadas por Valdivia (1606), Febrés ([1765] 1882, 1765, 1846a, 1846b), Augusta (1916a, 1916b), y por el CORLEXIM para representarlos1.

La segunda modificación consistió en la inclusión de la sexta vocal <ü> (entre corchetes) en los contextos en que los lexicógrafos misioneros la omitieron2. Y la tercera y última fue la corrección de los errores de escritura presentes en los originales.

Con respecto a los textos en español, también se realizaron en ellos tres grandes modificaciones: se normalizó su ortografía, se corrigieron errores de escritura presentes en los originales y se actualizaron las palabras en desuso; en esta última tarea se utilizaron como fuente de consulta el Diccionario de la Lengua Española (Real Academia Española, 2001) y el Corpus de Referencia del Español Actual (Real Academia Española).

Además, en el caso particular del diccionario de Augusta (1916b) se escribieron con negrita las vocales que en el original llevaban tilde.

Todas estas modificaciones tuvieron como objetivo facilitar las búsquedas al usuario de este corpus.


1 La única modificación ortográfica que hasta el momento no se ha realizado (dada la envergadura del material y la imposibilidad de realizar los cambios de manera completamente automática) es la escritura de los alófonos [u̯] y [i̯] como /w/ e /y/, respectivamente, en Augusta (1916a y b).

2 Hasta el momento esta modificación sólo se ha realizado en Augusta (1916b).

Tareas en curso

Actualmente estamos trabajando en las versiones originales de los diccionarios considerados en este corpus, con el objetivo de incluirlas junto con las versiones modernizadas. Además, seguimos trabajando en la escritura de los alófonos [u̯] y [i̯] como /w/ e /y/, respectivamente, en Augusta (1916a y b), y en la inclusión de la sexta vocal en las obras de Valdivia (1606), Febrés ([1765] 1882, 1765b, 1846a y b), Augusta (1916a).

Sugerencias para la realización de búsquedas

Sugerimos a los usuarios de este corpus que ingresen como búsqueda -sobre todos en Augusta (1916a y b)- raíces de palabras en mapudungún y no palabras completas.