Estudiantes de la UNAM diseñan traductores de lenguas indígenas

El proyecto contempla las voces wixárika, ayuuk, náhuatl, mexicanero y yorinoqui

Especialistas del Instituto de Investigaciones en Matemáticas Aplicadas y Sistemas (IIMAS) de la UNAM trabajan en el desarrollo de un programa que ayude a traducir de forma automática las lenguas indígenas wixárika, ayuuk, náhuatl, mexicanero y yorinoqui.

El proyecto permitirá traducir palabras y frases de una lengua a otra a través de redes neuronales, es decir, un modelo computacional que usa conceptos matemáticos comunes para imitar un proceso.

Iván Vladimir Meza Ruiz, titular del proyecto, explica que ha sido complicado desarrollar el traductor porque es todo un reto trabajar las lenguas indígenas y encontrar a alguien que quiera traducirlas.

De acuerdo con los creadores, lo complejo es encontrar valores específicos para las acciones del sistema y lograr que una frase sea traducida de una lengua a otra.

En México existen 68 agrupaciones lingüísticas, de las cuales existen 364 variantes, pero existen muy pocos programas para interpretar y traducir las lenguas indígenas.

Meza Ruiz, quien es especialista en inteligencia artificial, comenzó el proyecto desde 2014 con ayuda de otros estudiantes que tienen relación con las comunidades indígenas y colaboran con la recolección de datos.

El reto, asegura, es alimentar el cuerpo de datos en todas las lenguas y en español para que el programa aprenda a reconocerlos.

“Para lenguas originarias los corpus (cuerpos de datos) más grandes están cerca de los 10 mil ejemplos, en comparación con los millones de los sistemas comerciales. Estamos muy lejos de tener una experiencia similar a la que tenemos al usar un traductor normal, porque tenemos muy poquitos datos. Esa es parte de nuestra batalla ahorita: conseguir más datos e incrementar nuestros ejemplos”, amplió Delfino Zacarías Márquez Cruz, estudiante del IIMAS y hablante de ayuuk.

Además, la complejidad también surge porque las lenguas originarias son predominantemente orales y en diversos casos no está decidido cómo se escriben las palabras, conceptos o frases completas.

El equipo ya consideró algunas pérdidas en la traducción porque no hay forma de transmitir por escrito lo que las comunidades hablan.

El primer avance del traductor es para la lengua wixárika y se puede consultar en este enlace.

Los investigadores señalaron que necesitan apoyo para seguir desarrollando la herramienta para preservar el uso de lenguas indígenas.

Fuente: lajornadamaya.mx