Alexa pronto podría ser una cosa del pasado
Investigadores de la Universidad Carnegie Mellon han desarrollado un sistema para interactuar con altavoces inteligentes y otros dispositivos asistidos por voz sin usar palabras de activación.
El sistema, que se basa en el aprendizaje automático, podría ser la base de una alternativa segura a los asistentes domésticos siempre activos.
¿Cómo funciona el nuevo sistema?
Los nuevos hallazgos fueron publicados en un artículo por un equipo de investigación de cuatro personas, quienes también proporcionaron un video que explica cómo podría funcionar el nuevo modelo.
La investigación se concentra en la Dirección de la Voz , una técnica que determina tanto la posición como el ángulo de donde proviene el habla. Esto difiere de los dispositivos inteligentes actuales, que tienden a enfocarse solo en la posición de origen de un sonido. El enfoque actual también se basa en una palabra de activación específica, por lo que cambiar la palabra de activación de Alexa a otra solo le brinda una o dos opciones más.
Cuando una persona habla, su voz crea ecos en la habitación, que llegan a un altavoz inteligente en diferentes momentos. Al analizar la sincronización, el volumen y el espectro de frecuencia del sonido que produce cada eco reflejado, el nuevo sistema puede predecir si un usuario está hablando en la dirección del objeto inteligente o de espaldas.
Junto con el artículo de investigación, el equipo también proporcionó un enlace de GitHub al conjunto de datos utilizado para entrenar la red neuronal. Las 11520 frases únicas en el conjunto de datos fueron suficientes para entrenar a un hablante inteligente a predecir el ángulo al que se enfrenta un usuario con una precisión de 90 grados.
Los cálculos necesarios para determinar la dirección son lo suficientemente livianos como para realizarse en el dispositivo localmente sin conectarse a un servidor remoto. El equipo de investigación detrás de los nuevos hallazgos espera que este enfoque permita interacciones más fluidas con dispositivos inteligentes y ofrezca más privacidad a los usuarios que las alternativas basadas en la nube.
No hay un cronograma sobre cuándo esta tecnología podría aparecer para uso público, pero la base está ahí para abolir la necesidad de palabras de activación eventualmente. Cuando ya no necesite llamar a un altavoz inteligente por su nombre, ¿realmente lo necesita?
¿El fin de los asistentes domésticos personificados?
Si bien esta investigación abre nuevas y emocionantes posibilidades para interactuar con dispositivos inteligentes, no es probable que reemplace por completo las palabras de activación. Después de todo, uno de los principales atractivos de los altavoces inteligentes es que puede interactuar con ellos puramente vocalmente mientras realiza otras tareas.
Quizás prometa un futuro en el que se puedan utilizar varios dispositivos inteligentes en el mismo espacio. En lugar de despertar todos los dispositivos inteligentes al alcance del oído, puede pedirle a un solo dispositivo que le proporcione el informe meteorológico en silencio.
Todavía es temprano, pero una tecnología como esta podría hacer que las interacciones fluidas entre humanos y computadoras de la ciencia ficción sean una realidad en un futuro no muy lejano.