Publicidad
Tecnología

UNAM usa inteligencia artificial para preservar lenguas originarias

Publicidad

Especialistas del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM desarrollan proyectos basados en inteligencia artificial (IA) para generar registros digitales de las lenguas originarias de México, con el objetivo de preservar su uso y documentarlas ante el riesgo de desaparición.

El investigador Iván Vladimir Meza Ruiz, del Departamento de Ciencias de la Computación de esa entidad universitaria, explicó que las herramientas de IA permiten crear repositorios digitales y modelos lingüísticos que ayuden a conservar estas lenguas, incluso en casos donde el número de hablantes es cada vez menor.

“Esta herramienta ayudará a que permanezcan vivas, aunque sea de manera artificial, pues muchas de ellas carecen de hablantes”, señaló durante la conferencia “Inteligencia artificial y lenguas originarias de México”, presentada en la sexta sesión de la Cátedra Extraordinaria de Bioética, organizada por el Programa Universitario de Bioética (PUB) de la UNAM.

Menos hablantes en México

En México se reconocen 68 lenguas nacionales agrupadas en 11 familias lingüísticas y 364 variantes, muchas de las cuales enfrentan una disminución en el número de hablantes.

De acuerdo con los datos expuestos por el investigador, en 1930 alrededor de 15% de la población hablaba una lengua originaria, mientras que en 2020 la proporción se redujo a 6.2%. Además, quienes las utilizan con mayor frecuencia suelen ser personas de mayor edad, mientras que las generaciones jóvenes tienden a emplearlas menos.

Meza Ruiz indicó que una de las principales limitaciones para desarrollar herramientas tecnológicas en estas lenguas es la escasez de datos disponibles, indispensables para entrenar sistemas de inteligencia artificial.

Escasez de registros lingüísticos

El especialista explicó que la mayoría de los registros digitales de lenguas originarias son limitados. Como ejemplo, mencionó que en Wikipedia existen 4,272 artículos en náhuatl clásico, 1,201 en maya yucateco, 224 en náhuatl central, 113 en mixteco, 90 en hñahñu, 12 en purépecha y 10 en mixe del norte.

Además, señaló que los datos existentes se concentran principalmente en música, mientras que hay pocos registros del habla cotidiana, lo que dificulta crear modelos lingüísticos completos.

“Los datos existentes están sesgados hacia la música y hay escasos registros del habla”, indicó el investigador.

Desafíos éticos y tecnológicos

El desarrollo de repositorios digitales también enfrenta retos éticos y legales, ya que numerosos textos y materiales en lenguas originarias tienen derechos de autor y derechos morales de sus comunidades o creadores.

De acuerdo con Meza Ruiz, el reto consiste en equilibrar el enfoque de ciencia abierta, que busca compartir información para investigación, con la protección de los derechos culturales y patrimoniales de los pueblos originarios.

El especialista también señaló que contar con sistemas digitales en lenguas indígenas podría facilitar el acceso a servicios de salud, justicia, educación y trámites públicos, además de fortalecer su uso en espacios digitales.

Crear un ecosistema de datos

El siguiente paso para el desarrollo de estas herramientas es construir un ecosistema de recopilación de datos lingüísticos, que permita registrar de manera sistemática las lenguas originarias de México y utilizarlas en plataformas tecnológicas.

Según el investigador, muchas de estas lenguas tienen una tradición principalmente oral, lo que implica menos documentos escritos y, por tanto, menor disponibilidad de datos para su digitalización.

El proyecto busca ampliar esos registros mediante colaboración con comunidades hablantes y el uso de tecnologías de inteligencia artificial para documentar, preservar y analizar estas lenguas.

Con información de la UNAM.


Publicidad
Publicidad