Este dispositivo de inteligencia artificial me permite hablar en idiomas que no conozco ni entiendo
La Guía del autoestopista galáctico declara que el pez "Babel" es "probablemente la cosa más extraña del Universo". Se describe como un pez "parecido a una sanguijuela" que se mete en el oído, se alimenta de las ondas cerebrales del entorno y luego defeca dentro del oído para producir sonidos en un idioma que uno entiende. Efectivamente, es un dispositivo muy burdo y flagrante, pero extremadamente sofisticado, para la traducción en tiempo real.
Casi medio siglo después de que Douglas Adams escribiera la alucinante y trascendental (literalmente) convulsiva saga, el concepto de un pez de Babel todavía resulta muy fascinante. Si bien todavía no estamos tan cerca del nivel de traducción inmediata de las ondas cerebrales a las defecaciones, un montón de dispositivos están persiguiendo ese problema de una manera mucho menos repugnante. El modo Intérprete de Google y el Galaxy AI de Samsung son excelentes ejemplos de tecnologías de traducción que están disponibles, pero algunas marcas quieren abordar el problema por separado desde el teléfono inteligente. Timekettle es una de esas marcas, y su último centro de interpretación X1 es un dispositivo portátil que pretende hacerlo de manera diferente (léase: mejor) utilizando IA.
Soy trilingüe y me divertí probando exhaustivamente el X1 AI Interpreter Hub de Timekettle. Pero además de entretenerme, también lo usé para comunicarme en chino con el fundador de la empresa con sede en Hong Kong y durante un viaje a Malasia el mes pasado. Incluso me ofrecí como voluntario para acompañar a mi esposa a ver sus dramas coreanos favoritos sin necesidad de subtítulos, y a continuación detallaré cómo fue.
¿Qué hace que Timekettle X1 sea tan diferente?
No faltan dispositivos dedicados específicamente a la traducción. El propio Timekettle ofrece una gran cantidad de accesorios (varios de los cuales son portátiles) para resolver la brecha de comunicación entre dos idiomas muy distantes. Probablemente incluso hayas oído hablar de IA y traducción en la misma frase después de que ChatGPT realmente irrumpiera en escena a finales de 2022.
Pero el X1 AI Hub, según la compañía, adopta un mejor enfoque que muchas de las opciones existentes. Es una solución independiente que actualmente admite hasta 40 idiomas y 93 acentos, y se espera que se agreguen más con futuras actualizaciones de software. Incluso funciona sin conexión (para idiomas seleccionados) y admite traducciones a través de un altavoz o un par de auriculares (que vienen con él).
Cada concentrador X1 tiene un número de teléfono único que se puede utilizar para llamadas directas sin costo y sin restricciones geográficas, siempre que tenga conexión a Internet. Lo más importante es que cualquier traducción, ya sea en tiempo real o a través de una llamada telefónica, está cifrada de extremo a extremo, lo que evita que cualquier persona en el camino la intercepte e interprete. Todas estas características están empaquetadas en un dispositivo algo grueso, pero aún de bolsillo, que funciona con Android, lo que simplifica las actualizaciones de software para la empresa y los usuarios. También admite la interacción a través de la pantalla táctil.
Hardware único e inusual
Hablando de sus atributos físicos, el Timekettle X1 es un bloque rectangular con casi la misma longitud, pero la mitad del ancho de un teléfono de placa normal. Estas dimensiones hacen que sea bastante fácil de sostener y usar con una mano.
Lo primero que llama la atención es la pantalla táctil de 3,4 pulgadas, que sirve como medio principal, pero no el único, para interactuar con el traductor. Hay un botón multipropósito, capacitivo y no táctil al lado de la pantalla que generalmente activa un gesto de "atrás", pero que también se puede tocar y mantener presionado para activar el modo de traducción instantánea que analizaré más adelante. Hay dos conjuntos de botones táctiles en el lateral para funciones estándar como encendido y subir y bajar el volumen. Un pequeño micrófono se encuentra junto a estos.
La parte inferior del concentrador X1 tiene un puerto USB-C para cargar y una tira de altavoz. El área también cuenta con algunas plataformas de conexión para pines pogo, lo que resulta útil cuando se usa una base dedicada (se vende por separado) que puede cargar hasta cinco concentradores X1 simultáneamente. Esta parte del concentrador X1 también sirve como bandeja que utiliza un mecanismo de empuje para abrir o cerrar. La bandeja se utiliza para colocar los auriculares, que forman parte del dispositivo y se utilizan para transmitir voces traducidas directamente a sus oídos.
En el borde exactamente opuesto hay dos recortes más (presumiblemente para más altavoces) y un punto de contacto NFC que se puede usar para emparejar dos concentradores X1 al instante.
Los auriculares que forman parte del paquete vienen en un diseño intrauditivo parcial y, por lo tanto, no ofrecen ningún aislamiento de ruido. Si bien puede distraer un poco, esta es una elección consciente para garantizar que las voces reales de otras personas no queden silenciadas. El diseño semi-in-ear hace que los auriculares se caigan más fácilmente, y el gesto de Timekettle de incluir ganchos para las orejas y almohadillas de silicona para mantenerlos firmes parece reflexivo. Sin embargo, el hecho de que los auriculares deben volver a colocarse dentro del dispositivo cuando no están en uso hace que sea mucho más rápido perder los ganchos y, de hecho, terminé sin usarlos en absoluto.
Todavía desearía que hubiera una manera de emparejar auriculares personalizados con el concentrador, pero la compañía me dice que ha ajustado específicamente los algoritmos de supresión de ruido en función de los controladores de estos auriculares. Por lo tanto, la decisión de no admitir soluciones de escucha de terceros también es consciente, ya que interferiría con la recepción.
La interfaz es realmente fácil de entender e interactuar. Aunque todavía se basa en el obsoleto Android 10, la compañía me dijo que seguirá impulsando actualizaciones periódicas de la interfaz a lo largo de los años, principalmente para mejorar el vocabulario del algoritmo y la comprensión de la jerga y los acentos. Si bien sería bueno ver algunos cambios visuales en la interfaz, la compañía no hace afirmaciones al respecto.
Cómo funcionan las funciones de traducción
Timekettle Interpreter se puede implementar de diferentes maneras para que las conversaciones multilingües sean fáciles y sin esfuerzo. Si bien todos los modos tienen predominantemente el mismo propósito (traducir palabras habladas a su idioma preferido), cada uno está optimizado para diferentes escenarios. Según el modo, puede utilizar uno o varios concentradores Timekettle X1 para interactuar con otras personas.
Uno a uno
El primer modo está diseñado para conversaciones íntimas en persona entre sólo dos personas. Te pones uno de los auriculares dentro de la oreja y compartes el otro con la otra persona. Puede asignar diferentes idiomas a cada auricular y básicamente mantener el concentrador a un lado (pero dentro del alcance para que los auriculares permanezcan conectados).
Los auriculares escuchan y luego transmiten el mensaje al centro, que tarda aproximadamente un segundo en traducirse. Las palabras traducidas se transmiten instantáneamente al otro auricular. Todo esto sucede mientras la conversación completa se transcribe y se muestra en la pantalla del concentrador X1.
Las traducciones en este modo suelen ser precisas, pero no realmente convincentes. El modo requiere que haya una distancia suficiente entre los dos participantes para evitar que las voces del otro atraviesen los auriculares del otro. Si están sentados cerca, el centro tiende a no registrar las palabras correctamente o, a veces, las entiende correctamente, pero luego las sobrescribe con algo menos significativo.
Escuchar y reproducir
El siguiente modo es simplemente para escuchar hablar a otra persona sin tener que hablar usted mismo. En este modo, usted elige los idiomas, coloca el concentrador más cerca de la fuente de audio y luego coloca ambos auriculares dentro de sus oídos.
La aplicación es sencilla y los resultados son tan buenos como se esperaba. Dado que los micrófonos de los auriculares no están activados y, por lo tanto, no luchan entre sí, el habla se transmite con mayor fluidez.
Vale la pena señalar que, si bien las traducciones comienzan instantáneamente y se pueden ver en la pantalla, el concentrador X1 requiere un descanso de uno a dos segundos para comenzar a reproducirlas en los auriculares. Esto puede hacer que sea un poco difícil entender el contexto, especialmente cuando el hablante no sabe que necesita que retroceda un poco para que su dispositivo de traducción se active. Sin embargo, una vez que comienza, puede continuar sin interrupciones. Pero el discurso traducido llega a tus oídos unos segundos tarde, lo que, nuevamente, lo hace un poco nervioso.
Para ser justos, es más rápido y preciso que lo que ofrecen la mayoría de los teléfonos inteligentes. Como escribí, funciona bien una vez que el orador toma un pequeño descanso. Por lo tanto, el modo es efectivo para cualquier charla o presentación en línea a la que pueda asistir. No resulta muy práctico para ver una película o un programa de televisión en otro idioma porque el discurso traducido suena muy mecánico, sin emociones ni distinciones lingüísticas para los diferentes personajes. La compañía dice que estas funciones llegarán en una actualización futura, pero me reservaré mis pensamientos hasta que las use yo mismo.
Pregunta y listo
A diferencia de los dos modos anteriores que facilitan la traducción en entornos más silenciosos, Ask & Go es más adecuado para entornos más ruidosos y al aire libre. Más importante aún, realmente hace uso del diseño portátil, lo que permite un uso rápido y sencillo.
Puede configurar el idioma una vez e iniciar el modo para interactuar sin ningún requisito nervioso para compartir auriculares. El concentrador Timekettle X1 utilizará el micrófono externo para escuchar ambos idiomas y luego reproducirá la versión traducida a través de los altavoces. Una vez configurado el idioma, incluso puedes alternar este modo simplemente manteniendo presionado el botón capacitivo en el frente, lo que lo convierte en el modo más rápido y fácil de usar en el traductor.
Más importante aún, el modo permite que más de dos usuarios participen en una conversación y detecta automáticamente cuando se habla uno de los dos idiomas seleccionados. Esto es especialmente útil cuando viaja a un país extranjero y necesita interactuar con un local en un entorno social, como una calle.
Si bien la funcionalidad es similar a la que se puede lograr con un teléfono, la velocidad (y la precisión sorprendentemente mejorada en comparación con los modos que requieren auriculares) hacen que esta característica sea muy atractiva.
Llamada de voz
Otra característica notable, y quizás destacada, del centro de interpretación Timekettle X1 es su capacidad para realizar llamadas de voz multilingües, como llamadas normales por Internet. A cada unidad se le asigna un número de teléfono de seis dígitos que se puede usar para llamar a otra unidad en cualquier parte de la Tierra siempre que estén conectadas a Internet. Actualmente, la instalación está disponible de forma gratuita y ofrece traducción casi instantánea.
Para probar esta funcionalidad, hablé con Leal Tian, director ejecutivo y cofundador de Timekettle, utilizando la función de llamada de voz junto con una llamada de Zoom silenciada. Durante esta llamada, Tian habló en chino mientras yo hablaba en inglés. Nuestra conversación, que abarcó temas como la utilidad de este dispositivo, el uso del aprendizaje automático y el futuro de la empresa, se desarrolló completamente en dos idiomas separados. El flujo de la traducción fue mayoritariamente fluido, pero hubo algunos casos de repetición, especialmente cuando el dispositivo volvía a intentar traducir algo a mitad de una frase. Esto generó cierta fricción, pero el 90% de nuestra conversación transcurrió sin esfuerzo.
Como es de esperar, esto puede cambiar las reglas del juego para las empresas, especialmente si trabaja con un equipo de personas en diferentes regiones.
¿Qué hace la 'IA'?
El centro de interpretación de IA Timekettle X1 parece una solución práctica para llenar los vacíos de comunicación, especialmente en entornos empresariales. Un aspecto clave, debidamente representado por su nombre, es su dependencia de la IA. Durante mi conversación con el fundador de Timekettle, le pregunté sobre el papel que desempeña la IA en el dispositivo para saber si se trata realmente de una característica o si la empresa simplemente está sacando provecho de ella. Esto es lo que me dijeron:
El centro X1 AI Interpreter se basa predominantemente en dos modelos de lenguaje. El primero se conoce como TurboFast, que permite la traducción simultánea palabra por palabra en ambos idiomas. Según Timekettle, elige una ruta palabra por palabra en lugar de una ruta por oración para reducir el tiempo de espera mientras uno de los usuarios habla. El otro modelo se llama BoostClean , un modelo estadístico destinado a limpiar errores en un conjunto de datos y que se utiliza para suprimir el ruido de fondo.
Estos modelos de datos, según Tian, se actualizan constantemente en el lado del servidor, pero sin utilizar ningún dato privado de los usuarios, para aumentar la confianza de que el dispositivo no espiará sus conversaciones confidenciales. También me informaron que la empresa está evaluando actualmente el uso de traducciones personalizadas en cada dispositivo, para permitir a los usuarios registrarse y traducir jerga técnica o cualquier término profesional utilizado en contextos muy específicos. Esto podría entregarse como parte de una actualización futura.
Un gran dispositivo que se queda corto
Los seres humanos suelen ser más expresivos en sus lenguas nativas y es por eso que la traducción sigue siendo vital para comprender otras perspectivas. Al mismo tiempo, una biblioteca inmensamente grande y en constante evolución de diferentes idiomas con la ayuda de IA resuelve muchos problemas con las herramientas de traducción directa, especialmente en los teléfonos .
La amplia lista de funciones de Timekettle ayuda aún más a facilitar la comunicación en diferentes escenarios. Esto se vuelve aún más interesante cuando tenemos en cuenta la rapidez de las traducciones. En teoría, esto parece una herramienta indispensable, especialmente para entornos empresariales. Sin embargo, algunos defectos impiden que parezca tan eficaz como proyecta la empresa.
El centro X1 todavía sufre algunos problemas operativos, especialmente repetición de frases y traducciones fuera de contexto. Estos pueden impedir las conversaciones e incluso afectar negativamente el resultado. La otra cosa preocupante es su alto precio: una sola unidad cuesta $699 , lo que puede representar un gasto considerable, ya sea que usted sea una pequeña startup que busca simplemente impresionar a clientes internacionales o una gran corporación que busca atraer ejecutivos de alto nivel con una risa más fácil. Seguido de ese firme apretón de manos.
Sin duda, esto es mucho menos costoso si se tienen en cuenta los costos de por vida y las limitaciones de idioma que implica contratar a un intérprete humano. Sin embargo, la experiencia de un ser humano, incluso si se trata de un idioma, no puede ser superada por un dispositivo portátil. Un ser humano puede introducir más matices en las conversaciones o incluso mantenerse alejado de las traducciones directas para evitar conflictos después de sentir las emociones detrás del discurso, algo que la tecnología actualmente no puede lograr. El centro Timekettle, en el mejor de los casos, puede ayudar a los intérpretes humanos.
Además de los problemas funcionales, el intérprete de IA de Timekettle aún puede parecer mediocre, y tengo dos ideas que la marca puede implementar para solucionarlo. En primer lugar, el dispositivo necesita una función de detección automática para que los usuarios no siempre tengan que seleccionar idiomas manualmente antes de iniciar una conversación. En segundo lugar, realmente me gustaría usarlo con un asistente de voz para no tener que trastear con las opciones del menú, especialmente porque hay espacio limitado en esa pequeña pantalla.
Si bien no seré tan despiadado con el centro de IA Timekettle X1 como lo han sido muchos críticos con el pin Humane AI, simplemente porque no alcanza ese nivel de destreza teórica innovadora, espero que la compañía resuelva algunas de las preocupaciones. De esa manera, sería más fácil justificar este alto precio y recomendarlo a mis amigos y compañeros a quienes les encanta conversar en temas corporativos.