El Instituto Politécnico Nacional (IPN) anunció INDLEX (Indigenous lexicon), la aplicación móvil para el registro de las lenguas indígenas mexicanas que aportará profundos impactos sociales para el uso y preservación de este acervo nacional.
El desarrollo de este proyecto que se encuentra a cargo de alumnos pertenecientes al Laboratorio de Lenguaje Natural y Procesamiento de Texto, del Centro de Investigación en Computación (CIC) el cual innovará en el uso de las tecnologías por su aplicación en la recolección y documentación sistematizada de las lenguas indígenas mexicanas en sus versiones vivas.
Existen 68 lenguas indígenas en México que suman más de 7 millones de hablantes y 25 millones de personas que se identifican con dichos grupos lingüísticos aún sin hablar la lengua. Así mismo, las lenguas indígenas han sido reconocidas por la UNESCO como “herencia insustituible para la humanidad y […] un patrimonio invaluable para la sociedad”. Debido a falta de mecanismos efectivos para su documentación, estas lenguas se encuentran en declive y alto riesgo de extinción.
“En este proyecto utilizaremos técnicas de programación novedosas que permitan brindar a los hablantes bilingües –indígena/español–, una manera sencilla y rápida de registrar traducciones, y realizar anotaciones de multimedia en su lengua y variante indígena. La información recolectada por INDLEX servirá a investigadores de humanidades y de inteligencia artificial que requieran mayores recursos léxicos y desarrollar tecnologías del lenguaje en beneficio de las comunidades indígenas de México, explicó Christian Efraín Maldonado Sifuentes.
En el mundo existen cerca de 7000 lenguas habladas y se estima que la mitad están en peligro de desaparecer en el transcurso de este siglo. Por ello se han desarrollado esfuerzos como los de Broadwell et al, 2020 y Harrison et al 2019, para el rescate de las lenguas en peligro de desaparecer.
La aplicación INDLEX busca simplificar la recolección de traducciones de palabras y recursos multimedia representados en múltiples lenguas indígenas de México y sus más de 360 variantes lingüísticas. Permitirá interfaz sencilla y amigable para ser usada por cualquier persona bilingüe (indígena/español); operar en condiciones de baja conectividad, o utilizar la app sin conexión a internet empleando tecnología de sincronización de datos; Implementar una base de datos abierta que almacene múltiples traducciones de cada vocablo por lengua y variante, permitiendo la expresión natural de los hablantes; desarrollar un sistema multi-usuario para que diversos hablantes puedan trabajar con un solo dispositivo. Asimismo, fácil acceso a los datos para que investigadores de diferentes áreas y disciplinas puedan hacer uso de los mismos con fines académicos y de preservación de lenguas.
En el equipo, cuyo co-responsable técnico es el Dr. Grigori Sidorov, del Centro de Investigación en Computación del IPN, participan los alumnos Jason Efrain Angel Gil, José Eduardo Valdés Rojas, José Ricardo Jimenez Yáñez, Alain Pacchiano Alemán, Sergio Gabriel Sánchez Valencia, Christen Danae Maldonado Ortega. Han participado como autores, co-organizadores y asistentes en prestigiosos congresos internacionales de la inteligencia artificial, y el procesamiento de datos donde se resaltan las aplicaciones a comunidades de lenguas entre las que destacan AmericasNLP y la Escuela de verano de NAACL.
Así mismo, son organizadores del 2do. congreso de Procesamiento de Lenguaje Natural para Lenguas Indígenas (PLN Indígenas), colaboradores en la asociación de NLP for Social Good y fundadores de AMNLP, asociación que busca el avance de las minorías mediante el procesamiento de lenguaje natural. Tiene una colaboración cercana con el equipo de activistas, investigadores, y desarrolladores de Miyotl, una comunidad de programadores y hablantes de lenguas indígenas que desarrollan un App para la preservación de estas lenguas y ha causado un gran impacto en diversas partes del mundo con más de 30,000 descargas y 2,500 usuarios activos diariamente.
Deja un comentario