20 octubre,2022 12:06 pm

Meta trabaja en una tecnología basada en IA capaz de traducir lenguas no escritas

 

Madrid, España, 20 de octubre de 2022. Meta aseguró que está desarrollando una tecnología basada en Inteligencia Artificial (IA) que sea capaz de traducir idiomas que no disponen de una gramática y una ortografía oficial, esto es, lenguas no escritas.

La compañía hizo un adelanto del desarrollo de su proyecto Universal Speech Translator (UST), con el que busca crear un modelo de traducción en tiempo real en todos los idiomas existentes, para “romper barreras y unir a las personas”, según indicó en un comunicado.

Este proyecto, que se centra en fomentar la comunicación hablada en diferentes escenarios, tanto en el mundo real como en el metaverso, contempla dar soporte a todos los idiomas, independientemente de que sean escritos y hablados o exclusivamente hablados.

Meta comentó que, hasta ahora, la traducción mediante IA “se centra principalmente en las lenguas escritas” y reconoce que existen más de 7 mil idiomas vivos en todo el mundo de los cuales cerca de la mitad “no disponen de un sistema de escritura estándar o ampliamente utilizado”.

Asimismo, reiteró que es consciente de ese vacío existente en estos últimos debido a que los modelos de aprendizaje automático precisan de mayor información para desarrollar una traducción simultánea. Por ejemplo, gramática y ortografía.

Para hacer frente a este reto, creó su primer sistema de traducción para una lengua principalmente oral, como es el hokkien. Esta, que se habla en algunas regiones chinas, carece de una forma escrita estándar, por lo que inicialmente no se podría traducir mediante sus estándares de IA.

Para trabajar en este proyecto, la compañía señala que la recopilación de datos “fue un obstáculo importante”, principalmente porque no tenía información suficiente para crear modelos de “machine learning”.

Para dar solución a esta falta de información, Meta aprovechó el chino mandarín como lengua intermedia para construir traducciones relativamente fieles. En primes lugar, tradujo el habla hokkien a texto mandarín. Como consecuencia de este paso intermedio, el resultado de la traducción mejoró al tomar como referencia los datos de un idioma similar.

A continuación, mediante un modelo de entrenamiento, se analizó la semántica y la oratoria de esta lengua y se comparó con otras lenguas que sí disponen de un formato escrito, como el inglés. Después, sintetizó la lengua inglesa a partir de textos escritos y originó una lengua paralela entre el hokkien y el inglés.

Un sistema de voz a voz

La compañía recordó que buena parte de los sistemas de traducción se basan en transcripciones de voz a texto y reformuló este concepto para analizar las transcripciones de voz a voz.

Para ello, utilizó la traducción de voz a unidad (S2UT) para traducir la voz en una secuencia de unidades acústicas y generar diferentes formas de ondas a partir de estas. Después, se adoptó UnitY para un mecanismo de decodificación de dos fases.

Primero, el decodificador genera el texto traducido de la lengua no escrita a un texto en un idioma afín (en este caso, el mandarín) y, a continuación, crea unidades acústicas. En este sentido, el fabricante ha reconocido que ha desarrollado un sistema que transcribe el habla hokkien a una notación fonética estandarizada llamada Tâi-lô.

Por otra parte, recordó que los sistemas de traducción de voz se suelen evaluar utilizando una métrica denominada ASR-BLEU. Este sistema consiste en transcribir primero a texto el habla traducida mediante “machine learning” y, después, calcular la calidad de la transcripción de esta solución tecnológica, comparando el texto traducido por la máquina con el traducido por una persona.

Debido a que esto no es posible con el hokkien, porque no dispone de una gramática escrita, Meta creó su primer conjunto de datos de referencia de traducción bidireccional. Se trata de un sistema de código abierto en el que pueden participar los investigadores para avanzar en este sistema de traducción propio de Meta.

Finalmente, la compañía adelantó que esta solución de traducción actualmente está en sus primeras fases y que espera que próximamente sea capaz de ofrecer una traducción simultánea entre varios idiomas.

Asimismo, aseguró que este proyecto se puede extender a más lenguas, aparte del hokkien y, por ello, anunció que va a publicar un corpus de traducciones de voz a voz llamado SpeechMatrix, que extrajo de su herramienta de representaciones de oraciones agnósticas del lenguaje (LASER).

Texto: Portaltic/EP