Meta está construyendo un ‘traductor de idiomas universal’ de la era espacial

Cuando piensas en herramientas dotadas de inteligencia artificial (IA) en estos días, es natural que te vengan a la mente ChatGPT y Bing Chat . Pero Meta, propietario de Facebook, quiere cambiar eso con SeamlessM4T, un “traductor de idiomas universal” impulsado por inteligencia artificial que podría convertir instantáneamente cualquier idioma del mundo en el resultado que desee.

Meta describe SeamlessM4T como "el primer modelo de traducción y transcripción de IA multimodal, multilingüe y todo en uno". Eso es bastante complicado, pero en términos simples, significa que puede convertir idiomas de diferentes maneras, como tomar audio de voz y convertirlo en texto en una lengua diferente.

Una silueta de persona sostiene un teléfono inteligente que muestra el logotipo de Facebook. Están parados frente a un cartel que muestra el logo de Meta.

Según Meta, las funciones de traducción y reconocimiento de voz de la herramienta pueden funcionar de diferentes maneras:

• Reconocimiento de voz para casi 100 idiomas
• Traducción de voz a texto para casi 100 idiomas de entrada y salida
• Traducción de voz a voz para casi 100 idiomas de entrada y 36 idiomas de salida (incluido el inglés)
• Traducción de texto a texto para casi 100 idiomas
• Traducción de texto a voz para casi 100 idiomas de entrada y 35 idiomas de salida (incluido el inglés)

Meta dice que esto "permitirá a las personas comunicarse sin esfuerzo a través de voz y texto en diferentes idiomas".

¿Próximamente en Facebook?

La herramienta de traducción de IA de Meta, SeamlessM4T, convierte la entrada en español al vietnamita, tanto en formato de texto como de audio.

SeamlessM4T se lanza bajo una licencia de investigación y Meta afirma que lo hace para "permitir a los investigadores y desarrolladores desarrollar este trabajo". Además, los metadatos del conjunto de datos que se utilizó para entrenar el modelo de traducción, llamado SeamlessAlign, también se hacen públicos. Esto consiste en “270.000 horas de alineaciones de voz y texto extraídas”, afirma Meta.

Sin embargo, Meta no dejó claro de dónde provienen estas 270.000 horas de “discurso minado”. Han surgido preocupaciones sobre las implicaciones para la privacidad del trabajo de Meta en los chatbots de IA , mientras que otras herramientas de IA ya han sido descubiertas robando trabajo protegido . Sin duda habrá temores de que Meta pudiera haber hecho algo similar cuando entrenó a SeamlessM4T.

Ya existen otras herramientas de traducción como Google Translate que pueden convertir texto en texto y voz en texto, pero Meta dice que sus propios esfuerzos son superiores. SeamlessM4T, sostiene Meta, "reduce errores y retrasos, aumentando la eficiencia y la calidad del proceso de traducción".

Meta no ha dicho si la nueva herramienta se integrará en sus aplicaciones como Facebook e Instagram, pero la compañía sí reveló que su objetivo era "explorar cómo este modelo fundamental puede permitir nuevas capacidades de comunicación" en el futuro. Tendremos que ver qué implica eso.