Investigadores de la Universidad de Ciencia y Tecnología de Pohang (POSTECH) han desarrollado una innovadora tecnología portátil capaz de convertir el habla silenciosa en voz audible mediante la lectura de sutiles movimientos de los músculos del cuello. El estudio, liderado por el profesor Sung-Min Park y el Dr. Sunguk Hong, fue publicado en la revista Cyborg and Bionic Systems, lo que representa un importante avance en la comunicación entre humanos y máquinas.
De los movimientos musculares a las palabras habladas
Esta innovación se basa en una idea simple pero poderosa: el habla no se limita al sonido. Cuando una persona habla, o incluso intenta hablar en silencio, se producen pequeños movimientos en los músculos y la piel del cuello. Estos movimientos forman una especie de "mapa invisible" del habla que se pretende pronunciar.
Para capturar esta información, los investigadores crearon un dispositivo portátil llamado sensor de mapeo de deformación multiaxial. El sistema combina una cámara en miniatura con silicona flexible con marcadores de referencia integrados, lo que le permite detectar incluso las deformaciones más pequeñas de la piel. Diseñado para uso diario, el sensor se puede llevar cómodamente en el cuello y se recalibra automáticamente al cambiar de posición.
Los datos recopilados se procesan mediante inteligencia artificial, que interpreta los patrones de tensión vocal y reconstruye las palabras o frases deseadas. Al combinar esto con la síntesis de voz entrenada con el perfil vocal del usuario, el sistema puede generar un habla que se asemeja mucho a la voz natural de la persona, incluso cuando no se produce ningún sonido.
Un salto práctico respecto a los sistemas existentes.
Los métodos tradicionales de restauración de la voz se basan en tecnologías como la electromiografía (EMG) o la electroencefalografía (EEG), que a menudo requieren equipos voluminosos y pueden resultar incómodos para un uso prolongado.
El enfoque del equipo de POSTECH elimina estas barreras al ofrecer una alternativa ligera y portátil. En las pruebas, el sistema demostró una alta precisión en la reconstrucción del habla, incluso en entornos ruidosos como los industriales, donde los micrófonos convencionales tienen dificultades.
Impacto en el mundo real y potencial futuro
Las implicaciones de esta tecnología son de gran alcance. Podría proporcionar una nueva vía de comunicación para los pacientes que han perdido la voz debido a daños en las cuerdas vocales o a una cirugía laríngea, permitiéndoles "hablar" de nuevo utilizando su propio perfil vocal.
Más allá del ámbito sanitario, el sistema podría facilitar la comunicación silenciosa en entornos donde hablar en voz alta resulta poco práctico, como bibliotecas, reuniones o lugares de trabajo ruidosos. Además, abre la puerta a interfaces humano-IA más naturales, donde la intención se puede traducir en voz sin vocalización física.
Mirando hacia el futuro
Los investigadores buscan perfeccionar la tecnología para su implementación en entornos reales, mejorando la precisión y ampliando las capacidades lingüísticas. Las futuras versiones podrían integrarse de forma más fluida con los dispositivos de consumo, transformando potencialmente la manera en que las personas se comunican tanto en el ámbito personal como profesional.
A medida que la IA continúa fusionándose con la tecnología portátil , innovaciones como esta señalan un cambio hacia formas de interacción más intuitivas y discretas, donde incluso las palabras no pronunciadas finalmente pueden ser escuchadas.
