Agregar IA a Alexa es el trasplante de cerebro que todos estábamos esperando

El Amazon Echo Show 8 en el Devices Event 2023.

"Alexa, pon la cocina en modo cocinar", solicita inocentemente mi esposa.

“¿Qué quieres decir con modo de cocción?” sus agujas torturadoras digitales.

"Alexa, modo de cocción ", intervengo, pronunciando la frase exactamente como estaba configurada en la aplicación.

Las luces de la cocina se iluminan según lo previsto, pero parece que mi esposa está a punto de tirar el Echo a la basura.

Realmente no podía culparla en este momento. En una era en la que ChatGPT puede imitar de manera convincente a un estudiante de posgrado escribiendo un ensayo coherente de 1.500 palabras sobre los temas en grados Fahrenheit 451 en cuestión de segundos, Alexa sigue siendo una niña pedante de 9 años que espera negarte la sal en la mesa porque no dijo por favor.

Todo eso cambió –con suerte– el miércoles, cuando Amazon utilizó su evento anual de dispositivos de otoño para revelar lo que podría ser una característica que se necesita desesperadamente: la IA generativa . Y espero que salve a mi hogar de nuestra relación de palmadas en la cara con el tonto compañero de cuarto virtual que vive en nuestros parlantes.

Inferencias al rescate

Si vio al gurú de Alexa de Amazon, Dave Limp, demostrar la tecnología de modelo de lenguaje grande en el evento, se le podría perdonar que lo descarte como otro truco de salón de IA. La función "Chateemos" básicamente actúa como un mensaje ChatGPT hablado. Di algo, Alexa responderá.

"¿Cuáles son algunos buenos acompañamientos para acompañar el pollo a la barbacoa?" —Pregunta Dave. Alexa recomienda algunos. Hemos visto esto antes. Es lindo, pero realmente no estoy interesado en bromear con Alexa sobre los Seahawks o escuchar sus ingeniosas bromas sobre Florence y The Machine. Lo bueno quedó enterrado al final.

Dave Limp, vicepresidente senior de dispositivos y servicios de Amazon, demuestra la función Let's Chat de Alexa, impulsada por IA.

Alexa ahora hace inferencias, que han sido el santo grial perdido durante la existencia de casi una década del asistente. Para tomar un ejemplo de la presentación de Amazon, si instalas una nueva luz inteligente en tu sala de estar, Alexa ahora debería poder entender el comando "Alexa, enciende la nueva luz de la sala", incluso si le has puesto el nombre " lámpara."

Es nuevo. Es una luz. Esta en la sala. Alexa debería poder resolver esto, y finalmente puede hacerlo. Por simple que parezca, esto es un cambio absoluto para vivir en una casa inteligente.

En el caso de mi ejemplo inicial, las inferencias deberían permitirle a Alexa entender que quiero ejecutar la rutina llamada "modo de cocción" en la cocina, incluso si mi esposa no la invoca palabra por palabra con la frase mágica de la aplicación. Frases como “apaga todas las luces excepto las del salón” ahora son inteligibles para Alexa. Y eso es sólo el comienzo.

Increíble lo que un poco de comprensión puede hacer

La IA también abre muchas otras posibilidades. Por ejemplo, el reconocimiento de voz conversacional (CSR) significa que Alexa debería poder detectar pausas en el habla sin asumir que ya terminaste e interrumpir. Un nuevo motor de reconocimiento automático de voz (ASR) significa que Alexa no sólo debería comprender sus palabras con mayor precisión, sino que también será capaz de reconocer la entonación, como la emoción o la tristeza. Cuando estás en el modo Let's Chat, puedes responder a Alexa sin decir su nombre cada vez y acumular comandos como lo harías cuando hablas con un humano: "apaga las luces, abre las persianas y toca un poco de jazz".

Alexa ahora puede manejar múltiples solicitudes en una lista.

Y esto ya se necesitaba desde hace mucho tiempo: ahora puedes crear rutinas por voz. "Alexa, apaga la luz del porche a medianoche todos los días". Boom, listo. No puedo contar cuántas veces quise configurar algo conveniente, solo para posponerlo porque no quería alterar la aplicación, y finalmente me olvidé de hacerlo.

Ya era hora

¿Funcionará todo según lo prometido? Creo que todos lo sabemos un poco mejor. Incluso durante la demostración en vivo, Alexa se calló en respuesta a algunas órdenes y hubo que pedírsela nuevamente. Pero si ChatGPT sirve de indicación, la IA generativa es capaz de realizar hazañas realmente sorprendentes, y Alexa podría ser el caso de uso perfecto para ello. Podemos ser pacientes.

Esto es lo que he querido de Amazon durante años. No necesito un dron de seguridad para el hogar , un microondas de Alexa o un robot a medio hacer que se cae por las escaleras , solo necesito que Alexa ejecute las cosas que ya es capaz de hacer de manera más confiable, fácil y sin darme ganas de alimentarme. mi Echo en una licuadora.

Según los anuncios del miércoles, Amazon finalmente parece entenderlo.

Alexa, no arruines esto.