Durante siglos, las palabras cambian de significado, mutan, desaparecen o simplemente adoptan nuevos usos y Chile no es la excepción. Es en ese contexto, que académicos chilenos lograron reunir textos desde entre 1788 y 1995 que permiten abarcan más de dos siglos de historia.
El proyecto, llamado CoDiECh —Corpus Diacrónico del Español de Chile— funciona como una especie de “máquina del tiempo lingüística“. A través de búsquedas digitales, investigadores, estudiantes y curiosos pueden seguir el origen y transformación de palabras, expresiones y formas de hablar presentes en documentos judiciales, novelas, periódicos, cartas y otros registros históricos del país.
La iniciativa es liderada por el lingüista Claudio Garrido, de la Universidad Católica del Maule, junto a la profesora de la Universidad Adolfo Ibáñez, Catalina Insausti. Sobre su creación, Garrido explicó a The Clinic que notaron “la necesidad de crear un corpus lingüístico histórico del español de Chile a través de académicos que habían concebido la idea hace algunos años. Se viene hablando de este proyecto como por lo menos del año 2002 en la literatura especializada. Para nosotros era un anhelo todavía no realizado, porque necesitamos ese recurso para poder desarrollar nuestra disciplina, nuestras investigaciones”.
“Creo que un punto crucial fue que algunos colegas extranjeros nos animaron a tomar la iniciativa. A reunir textos, a hacer un trabajo como de transcripción semiautomática de archivos de la literatura del folclore chileno y nos decidimos. Postulamos a un proyecto externo financiado por la ANID, y ahí se dieron las condiciones para poder ejecutar la idea”, añadió.

El trabajo tras CoDiECh
Actualmente hay 206 documentos digitalizados, número que sigue creciendo con el pasar del tiempo dado que el equipo sigue con las transcripciones. Con respecto a la selección de textos, Insausti detalla que “al comienzo fue bastante intuitivo y comenzamos incluyendo textos donde nosotros mismos estábamos encontrando ejemplos relevantes para nuestros estudios. Por ejemplo, muchas revistas de principios del siglo XX eran fuentes a las que recurríamos constantemente en nuestros trabajos de investigación. Partimos seleccionando esas mismas fuentes para incorporarlas al corpus, pensando que podían servirnos a futuro y que también podían servir a otras personas que hicieran este tipo de investigación”.
“Después de eso, una vez que el cuerpo empezó a nacer, pudimos ver cómo estaban distribuidos los textos que teníamos según la época, los tipos de texto, y eso nos ha permitido ir siendo un poco más intencionales con la elección de lo que queremos incluir. Pero yo creo que el criterio principal que nos animó a hacer este corpus era tener una representación realista y variada de distintos registros de habla en el español de Chile“, destaca la académica.
Garrido apunta que esta plataforma, si bien nació para el trabajo como académico lingüístico, “tiene mucha aplicabilidad para concebir como estudios de divulgación sobre el español de Chile, conocer un poco más la cultura, la historia. Resulta que cuando pensamos nuestras palabras en el léxico patrimonial chileno, consideramos que son palabras vivas”.
¿Cachai?
Garrido afirmó que “nos llama mucho la atención. Todos conocemos palabras como pololo o cachar po. Somos conscientes de nuestras particularidades en el lenguaje, pero estas palabras naturalmente no nacieron ayer. Tienen una historia súper interesante, ha habido cambios en esas palabras a través del tiempo y este corpus funciona como una especie de archivo histórico de las historias de las palabras. Encontramos, entre comillas, algo así como las primeras fotografías que hay sobre estas palabras, que no creemos que sean los primeros usos, sino más bien las primeras documentaciones”.
“También es posible observar palabras que fueron muy comunes en el siglo pasado o hace un par de siglos y que perdieron vigencia, desaparecieron de la comunidad hablante (…) A mí me fascina realmente el caso de cachar cachai del español de Chile. Existe como la idea en la cultura popular de que es un anglicismo”, destaca.
“No sé si tú misma habías escuchado hablar de cachar como una palabra que viene de to catch del inglés, pero nosotros estamos convencidos, no sólo nosotros, esto también está difundido en la academia, estamos convencidos de que no es un anglicismo sino que es una palabra patrimonial que está emparentada con catear, con catear y que de hecho surge en el contexto rural. Esta es una idea que se había propuesto en la bibliografía, en estudios del español de Chile, hace tiempo, a principios del siglo XX, Rodolfo Lenz lo propuso”, asegura el académico.
¿Cómo se usa la plataforma?
Los investigadores destacan que CoDiECh es una plataforma especialmente intuitiva y de fácil uso para cualquier persona. Desde académicos o quienes sientan curiosidad por el lenguaje. “Está funcionando con acceso para quien quiera consultarlo. Eso es súper relevante, porque también es una particularidad de este corpus. Hay otros corpus que te requieren hacer una cuenta o dar algún tipo de información”, destaca la académica de la UAI. “Nosotros no lo pensamos de esa manera, lo pensamos como un acceso muy fácil y que permita a cualquier persona poder hacer las búsquedas que necesite para cualquier tipo de investigación”.
En ese sentido, Garrido indica que “quien quiera acercarse a este buscador de manera intuitiva, basta con que ponga la palabra y botón de búsqueda y de inmediato aparece el registro de todos los ejemplos históricos que de momento hay”.
“Una primera visualización simplemente es el contexto donde aparece la palabra. De qué año es, de qué obra se sacó ese ejemplo y quién es su autor. Esa es la información inicial que te dio y luego te permite ordenar los años y hacer búsquedas más precisas. Pero la información inicial es bien básica y comprensible. Si alguien quisiera ir más allá, también puede ver, por ejemplo, cómo está clasificado gramaticalmente ese uso de la palabra. Es decir, hay distintos niveles de visualización según lo que uno quiere buscar en el corpus“, añade Insausti.
Fuente The Clinic










