Las matemáticas del lenguaje

Gabriel Cachoa Ocampo



Los problemas intrínsecos de modelar al lenguaje matemáticamente exigen utilizar herramientas e ideas distintas a las que se usan por ejemplo para describir el movimiento de los cuerpos celestes, la dinámica de los fluidos o la mecánica de las partículas elementales. El origen y la evolución del lenguaje son objetos centrales en el estudio de sistemas complejos. Aunque no existe una única definición para describir a todos los sistemas complejos, una característica principal que cumplen es la emergencia. Las propiedades del sistema emergen a partir de las relaciones que guardan sus partes entre ellas o con su entorno pero que no presentan sus partes cuando están aisladas. El movimiento de un pájaro no es el mismo que cuando se mueve con toda su parvada. La temperatura de la superficie de la tierra no se puede entender sin tomar en cuenta todos los fenómenos naturales y artificiales que influyen en ella. La cognición no es el resultado de neuronas actuando independientemente. La evolución del lenguaje está determinada por factores sociales, culturales, geográficos y políticos. El lenguaje es una de las facultades humanas (y no humanas) que me parecen más interesantes y, a un nivel personal, estudiar el lenguaje desde las matemáticas es una oportunidad tremenda. En este pequeño texto comparto tres estrategias con las que se ha estudiado el lenguaje desde un enfoque matemático.


En 1999, M. A. Nowak y D. C. Krakauer de la Universidad de Princeton propusieron un modelo para estudiar la evolución del lenguaje. Más que modelo ellos le llaman “juego”. La idea es la siguiente: imaginemos un grupo de seres abstractos sin origen; cada uno de ellos emite un sonido para referirse a un cierto objeto. De acuerdo con las condiciones iniciales de cada uno de estos seres, algunos se podrán entender mejor con otros. Los que mejor se puedan comunicar serán los más aptos para reproducirse. Ellos dejarán más descendencia y esta tendrá la misma asociación de objetos y sonidos que su ascendencia. De esta manera, conforme el tiempo avanza y estos seres se reproducen se construye un consenso para la mayoría de la población o se divide la población entre quienes tengan diferentes consensos. Esta idea está claramente inspirada en la evolución biológica. Si tratamos de utilizar este juego para modelar la evolución del lenguaje entonces tendríamos que tomar en cuenta factores geográficos, históricos, culturales y sociales para que los seres abstractos y sin origen realmente modelen seres humanos. Este modelo surge de una idea reduccionista o abstracta que no se corresponde con la realidad, pero que puede ser la base sobre la que se reúnan un conjunto de disciplinas cuyo conocimiento permita construir un modelo para entender la realidad.


D.M. Abrams y S.H. Strogatz, en su artículo para la revista Nature titulado “Modelando la dinámica de la muerte de los lenguajes”, presentaron un modelo distinto que se basa en estudiar la competencia y prevalencia de los lenguajes . En este artículo, los autores proponen estudiar la competencia entre lenguajes, es decir cómo cambia el número de hablantes de lenguajes en un mismo espacio geográfico a través del tiempo. Su modelo se basa en sistemas dinámicos, es decir, proponen ecuaciones diferenciales que describen cómo cambia el número de hablantes en el tiempo. Para plantear estas ecuaciones, toman en cuenta como factor “la percepción de una lengua” para estimar la probabilidad con la que un porcentaje de la población cambia su lengua nativa por otra (en este modelo no se puede ser bilingüe). Las ecuaciones de Abrams y Strogatz han sido el punto de partida para modelos mucho más complejos y precisos. Es importante mencionar que por sí mismas describen cómo ha ido desapareciendo el gaélico escocés en Sutherland (Escocia), el quechua en Huanuco (Perú) y el galés en Monmouthshire (Gales). Una aplicación fascinante de este modelo la realizaron Luís F. Seoane, Xaquín Loredo, Henrique Monteagudo y Jorge Mira en su artículo de 2019 “¿Es posible que el Catalán y el Español coexistan en Cataluña?”. Su modelo contempla la distribución geográfica, las similitudes lingüísticas, los beneficios de aprender un idioma o el otro, la posibilidad de que existan personas bilingües, el perfil demográfico de los hablantes y la posibilidad de que haya personas que con el paso del tiempo olviden cómo hablar una de las dos lenguas. Como base de datos para establecer sus parámetros utilizan los resultados de encuestas que realiza el Institut d’Estadística de Catalunya desde el 2004. Uno de los principales resultados establece las condiciones suficientes, en términos de cantidad de hablantes de las dos lenguas y de personas bilingües, para que ambas lenguas puedan coexistir y ninguna se extinga.


En junio de 2020 un grupo de investigación en Estonia publicó el libro editado por Cambridge University Press Lenguajes en el espacio y en el tiempo: modelos y métodos desde la teoría de sistemas complejos. Para mí, este libro es de particular interés porque dedica algunas secciones a estudiar lenguas indígenas mexicanas. Se dice que en México hay 68 lenguas indígenas; sin embargo la Ley Federal de Derechos Lingüísticos de Pueblos Indígenas reconoce cada variante de cada lengua como una lengua nacional por sí misma. En total hay 364 variantes lingüísticas. Por ejemplo en el caso particular del mazateco hay 12 variantes y en el del tseltal hay 17. La investigación que presentan en el libro es de carácter comparativo entre la fonología, la morfología y las variaciones léxicas de las variantes lingüísticas. Para hacer esta comparación utilizan una herramienta de los sistemas complejos súper interesante: la teoría de redes. Cada variante lingüística se puede ver como un nodo y, a partir de ciertas condiciones, se determina si entre dos nodos hay una arista. Esas condiciones se establecen con métricas que comparan las palabras de las variantes, la posición geográfica, las raíces comunes, etcétera.


S.C. Gudschinsky, maestra rural de Michigan, consultora de lingüística en México y Brasil y la primera mujer de la organización SIL International en obtener un doctorado en Lingüística, realizó trabajos sobre el mazateco que ubicaron esta lengua como objeto de estudio relevante para la comunidad internacional de lingüistas.


La comparación a través de redes complejas de las lenguas indígenas mexicanas está en pañales; queda mucho por estudiar y comparar. El análisis entre las variantes cuenta con muy pocas palabras, las únicas comparaciones que se han realizado han comparado menos de 200 palabras entre las variantes de una misma lengua. Para que una revista de arbitraje internacional considere como válida la comparación de lenguas debe de contar con un mínimo de 30,000 palabras por idioma. También falta aprovechar los conocimientos sobre los orígenes del mazateco en un modelo de juego como el propuesto por Nowak y Krakauer. Y, por supuesto, un análisis sobre la posible coexistencia de estas lenguas con el español o entre ellas usando adaptaciones del modelo de Abrams y Strogatz. Las matemáticas que se utilizan para estudiar el lenguaje como sistema complejo son muy variadas y son inútiles sin un enfoque interdisciplinario. México alberga una diversidad lingüística gigantesca y estudiar las lenguas que viven con nosotros forma parte de reconocer su existencia y darles un lugar como el tesoro que son. El Instituto Nacional de Estadística y Geografía (INEGI) recopila las estadísticas sobre el número de personas que habla una lengua indígena y en cada censo el número disminuye.

Para cerrar, me gustaría compartir un poema de Miguel León Portilla, filósofo, historiador y experto en la cultura náhuatl:


Cuando muere una lengua


Cuando muere una lengua

Las cosas divinas,

Estrellas, sol y luna;

Las cosas humanas,

Pensar y sentir,

No se reflejan ya

En ese espejo.


Cuando muere una lengua

Todo lo que hay en el mundo

Mares y ríos,

Animales y plantas,

Ni se piensan, ni pronuncian

Con atisbos y sonidos

Que no existen ya.


Entonces se cierra

A todos los pueblos del mundo

Una ventana,

Una puerta.

Un asomarse

De modo distinto

A las cosas divinas y humanas,

A cuanto es ser y vida en la tierra.


Cuando muere una lengua,

Sus palabras de amor,

Entonación de dolor y querencia,

Tal vez viejos cantos,

Relatos, discursos, plegarias,

Nadie cual fueron

Alcanzarán a repetir.


Cuando muere una lengua,

Ya muchas han muerto

Y muchas pueden morir.

Espejos para siempre quebrados,

Sombra de voces

Para siempre acalladas:

La humanidad se empobrece.


Fotografía de Mariana Costa Villegas.