domingo, 25 de septiembre de 2022

IPN. DESARROLLAN APP PARA FORTALECIMIENTO DE LENGUAS INDÍGENAS

Existen 68 lenguas indígenas en México que suman más de 7 millones de hablantes y 25 millones de personas que se identifican con dichos grupos lingüísticos aún sin hablar la lengua. Así mismo, las lenguas indígenas han sido reconocidas por la UNESCO como “herencia insustituible para la humanidad y […] un patrimonio invaluable para la sociedad”. Debido a falta de mecanismos efectivos para su documentación, estas lenguas se encuentran en declive y alto riesgo de extinción.

    “En este proyecto utilizaremos técnicas de programación novedosas que permitan brindar a los hablantes bilingües –indígena/español–, una manera sencilla y rápida de registrar traducciones, y realizar anotaciones de multimedia en su lengua y variante indígena. La información recolectada por INDLEX servirá a investigadores de humanidades y de inteligencia artificial que requieran mayores recursos léxicos y desarrollar tecnologías del lenguaje en beneficio de las comunidades indígenas de México, explicó Christian Efraín Maldonado Sifuentes.

En el mundo existen cerca de 7000 lenguas habladas y se estima que la mitad están en peligro de desaparecer en el transcurso de este siglo. Por ello se han desarrollado esfuerzos como los de Broadwell et al, 2020 y Harrison et al 2019, para el rescate de las lenguas en peligro de desaparecer.

La aplicación INDLEX busca simplificar la recolección de traducciones de palabras y recursos multimedia representados en múltiples lenguas indígenas de México y sus más de 360 variantes lingüísticas. Permitirá interfaz sencilla y amigable para ser usada por cualquier persona bilingüe (indígena/español); operar en condiciones de baja conectividad, o utilizar la app sin conexión a internet empleando tecnología de sincronización de datos; Implementar una base de datos abierta que almacene múltiples traducciones de cada vocablo por lengua y variante, permitiendo la expresión natural de los hablantes; desarrollar un sistema multi-usuario para que diversos hablantes puedan trabajar con un solo dispositivo. Asimismo, fácil acceso a los datos para que investigadores de diferentes áreas y disciplinas puedan hacer uso de los mismos con fines académicos y de preservación de lenguas.

En el equipo, cuyo co-responsable técnico es el Dr. Grigori Sidorov, del Centro de Investigación en Computación del IPN, participan los alumnos Jason Efrain Angel Gil, José Eduardo Valdés Rojas, José Ricardo Jimenez Yáñez, Alain Pacchiano Alemán, Sergio Gabriel Sánchez Valencia, Christen Danae Maldonado Ortega. Han participado como autores, co-organizadores y asistentes en prestigiosos congresos internacionales de la inteligencia artificial, y el procesamiento de datos donde se resaltan las aplicaciones a comunidades de lenguas entre las que destacan AmericasNLP y la Escuela de verano de NAACL.

Así mismo, son organizadores del 2do. congreso de Procesamiento de Lenguaje Natural para Lenguas Indígenas (PLN Indígenas), colaboradores en la asociación de NLP for Social Good y fundadores de AMNLP, asociación que busca el avance de las minorías mediante el procesamiento de lenguaje natural. Tiene una colaboración cercana con el equipo de activistas, investigadores, y desarrolladores de Miyotl, una comunidad de programadores y hablantes de lenguas indígenas que desarrollan un App para la preservación de estas lenguas y ha causado un gran impacto en diversas partes del mundo con más de 30,000 descargas y 2,500 usuarios activos diariamente.


El doctor Gelbukh puso a México en el mapa internacional de la lingüística computacional, gracias a las investigaciones que se realizan en este laboratorio que desde hace años dirige...

 Estudiantes del IPN desarrollan sistema para aprendizaje de lenguas basado en IA

Será básicamente una aplicación móvil que, en su primera etapa, ayudará a los hablantes de inglés a aprender español

Al laboratorio de lenguaje natural y procesamiento de texto del Centro de Investigación en Computación (CIC) del Instituto Politécnico Nacional (IPN), llegan estudiantes de todo el mundo para aprender del multipremiado doctor, Alexander Gelbukh, un matemático ruso que desde hace 25 años vive en México porque, dice, es el mejor país para hacer investigación.

“He viajado por 60 países y conozco muchas universidades de todos los continentes y en ningún lugar del mundo hay condiciones para estudiar y condiciones para la investigación tan buenas como en México”, comentó Alexander Gelbukh.

El doctor Gelbukh puso a México en el mapa internacional de la lingüística computacional, gracias a las investigaciones que se realizan en este laboratorio que desde hace años dirige.

Actualmente, uno de los proyectos que aquí se desarrollan es un sistema para facilitar el aprendizaje de lenguas.

Será básicamente una aplicación móvil que, en su primera etapa, ayudará a los hablantes de inglés a aprender español.

“En estos momentos tenemos un prototipo funcional de la app, la cual funciona tanto en interfases móviles como en sitios web y la gran parte del proyecto está aún en desarrollo. Por ejemplo, creando ejercicios que los usuarios puedan contestar preguntas o puedan marcar en una selección múltiple”, señaló Jason Ángel, estudiante de doctorado en el CIC.

Sin embargo detrás de esta app, llamada Vocab Trainer, hay mucho trabajo de investigación en inteligencia artificial y ciencia de datos, lo que permite que las preguntas y ejemplos en la app se generen automáticamente.

“Aquí te tengo digamos como un ejemplo de qué es lo que hace “cómo se le dice a una mujer que es rey” o sea cuál es el equivalente de rey para una mujer, entonces al modelo se le pregunta aquí con esta línea de código y te debería dar como respuesta reina”, comentó Carlos Alberto Rodríguez Díaz, estudiante de doctorado en el CIC.

Este modelo de inteligencia artificial también toma en cuenta el cambio semántico, es decir, cómo el significado de las palabras ha variado a lo largo del tiempo.>

Si no entendemos los cambios semánticos no podemos entender cómo el vocabulario, y lo que las palabras y enunciados significan. Así que para entender el significado detrás de las palabras, tú tienes que entender el contexto detrás de ellas y el cambio semántico nos permite entender ese contexto explicó Sabur Butt, estudiante de doctorado en el CIC.

Esta app ayudará a docentes y estudiantes de español con ejemplos actuales que elaborará a partir de la información que encuentra en Internet.

“Lo que está sucediendo en internet en la actualidad, se convierte en parte de las preguntas que tú estás teniendo para tus alumnos como profesor, para el estudiante esto también es muy importante. Para el profesor es importante porque tiene menos trabajo y tiene más recursos, se pueden generar preguntas de manera automática para que cada alumno tenga un examen independiente, por ejemplo”, puntualizó Christian Maldonado Cifuentes, estudiante de doctorado en el CIC.

La app podría estar lista para ser usada por el público en unos ocho meses.