El sistema permitirá traducir de manera bidireccional entre el español y la lengua tsotsil. Además, transcribir de voz a texto y convertir texto a voz con acento nativo
Más de cuatro millones de jóvenes y adultos en México no saben leer ni escribir, según datos del Instituto Nacional para la Educación de los Adultos (INEA). Chiapas es la entidad con mayor índice de analfabetismo, con el 11.5% de la población de 15 años o más; es decir, entre 11 y 12 personas de cada 100 son analfabetas.
Además, el Censo de Población y Vivienda 2020 del Instituto Nacional de Estadística y Geografía (INEGI) señala que el 28.2% de la población chiapaneca habla alguna lengua indígena. Una de las más habladas es el tsotsil, lengua de origen maya presente en los pueblos de los Altos de Chiapas y utilizada por alrededor de 550,000 personas.
Plataforma para fortalecer la alfabetización bilingüe
Es en la zona de los Altos de Chiapas que los investigadores de la Escuela de Humanidades y Educación (EHE) del Tec de Monterrey, en colaboración con la Secretaría de Educación de Chiapas, desarrollaron una solución tecnológica para hacer frente al analfabetismo en esa región y también para promover la justicia social y la preservación lingüística de los pueblos originarios.
Se trata de una plataforma de alfabetización bilingüe tsotsil-español impulsada por inteligencia artificial (IA) y diseñada para operar sin conexión a internet, señala Alejandro Martín del Campo, investigador y líder de la iniciativa.
Más allá de funcionar como un traductor, el proyecto busca generar un proceso educativo que reconozca y dignifique la lengua originaria, mientras se abre la puerta a más oportunidades a través de un bilingüismo funcional con el idioma español, agrega el investigador.
“El objetivo es que esta plataforma acompañe un proceso de doble alfabetización. Queremos que las personas que habitan en diferentes localidades tengan la opción de fortalecer su conocimiento del tsotsil, perfeccionarlo, terminar de aprenderlo o incluso retomarlo si lo han dejado de usar. Pero también buscamos que ese aprendizaje se complemente con el español, de modo que puedan comunicarse fluidamente en ambos idiomas”, explica.
¿Qué puede hacer el sistema de IA?
Esta herramienta permitirá:
- Transcribir voz a texto en tsotsil y en español.
- Traducir de manera bidireccional entre ambas lenguas.
- Convertir texto a voz con acento nativo.
- Operar sin conexión a internet en dispositivos móviles o computadoras escolares.
Esta iniciativa forma parte del Digital Society Lab de la EHE, que promueve la preservación de las lenguas originarias a través de las humanidades digitales. El equipo está integrado por pedagogos, que diseñan las rutas de aprendizaje y materiales educativos para diferentes públicos, y especialistas en tecnologías, que trabajan en el diseño de la plataforma y la integración de la IA. Además, colabora con aliados del gobierno de Chiapas y de las comunidades tsotsiles para la revisión y validación lingüística y la implementación en zonas rurales.
¿Cómo se entrenan los modelos en lengua tsotsil?
El sistema se apoya en una arquitectura tecnológica que integra al menos cuatro modelos de IA basados en redes neuronales para el procesamiento de lenguaje natural. Estos modelos se entrenan con corpus lingüísticos que se recopilan directamente de hablantes nativos de tsotsil, es decir, con cuentos tradicionales, frases y palabras que se obtienen a través de entrevistas.
Gabriela Salas es una de las investigadoras del equipo y tiene experiencia previa en un proyecto similar de traducción automática de náhuatl-español potenciado por IA, el cual inició en 2020 y desarrolló a lo largo de tres años, alcanzando cerca del 70% de precisión y su aceptación por Google Translate. Ella es la encargada de integrar el corpus lingüístico para entrenar a la IA en este proyecto; sin embargo, señala que “el tsotsil es más difícil que el náhuatl porque no sigue la lógica del español; es una lengua aglutinante con raíces mayas, sus estructuras son complejas y hay que validar todo con hablantes nativos antes de entrenar el modelo”.
Sobre el avance, detalla que el proyecto registra un 40% de progreso. Hasta ahora se han recopilado alrededor de 17,000 frases y 20,000 palabras individuales. La meta es alcanzar al menos 21,000 frases validadas para asegurar que el modelo aprenda a partir de ejemplos correctos tanto en lo gramatical como en lo cultural.
¿Cómo se implementará en las comunidades?
Cuando se complete la validación y el entrenamiento del sistema, el equipo buscará precargar la plataforma en dispositivos móviles o en computadoras instaladas en centros comunitarios y escuelas para que pueda funcionar sin conexión a internet, explica Martín del Campo. También, integrar una función tipo chatbot para que las personas puedan interactuar, enviar mensajes y recibir retroalimentación.
“El modelo funcionará en una versión ligera, precargada en los dispositivos que ya están disponibles en las comunidades. Además, estamos evaluando que, cuando los educadores acudan a los centros con conectividad, puedan descargar nuevos recursos o actualizaciones del sistema, con versiones más afinadas del modelo”, dice.
Colaboración entre el Tec y el gobierno de Chiapas
Martín del Campo destaca que el proyecto se integra a un programa social llamado “Chiapas Puede” a través de un convenio de colaboración entre el Tec de Monterrey y el gobierno de ese estado. Esto permite el acceso a las comunidades para validar e implementar el sistema y aprovechar la infraestructura existente en los centros educativos.
El equipo espera que en aproximadamente año y medio, la plataforma haya superado las pruebas piloto y pueda funcionar en contextos reales de alfabetización bilingüe en las comunidades tsotsiles. Con este proyecto, el equipo también busca demostrar que tecnologías como la IA pueden ser un medio para lograr un bien común, como conectar culturas, promover la equidad y el acceso a la educación.
“Muchas veces usamos la tecnología en las grandes urbes, pero cuando se empuja en un tema mucho más comunitario y social es cuando se entiende su verdadero impacto”, dice el investigador.
Fuente: tecscience.tec.mx


Deja una respuesta