Google Gemini facilita la navegación web a usuarios con problemas de visión y audición

Los dispositivos Android llevan años ofreciendo una función de lector de pantalla integrada llamada TalkBack . Esta función ayuda a las personas con problemas de visión a comprender lo que aparece en la pantalla de su teléfono y les permite controlarlo con la voz. En 2024, Google incorporó su inteligencia artificial Gemini para ofrecer a los usuarios una descripción más detallada de las imágenes.

Google ahora lo refuerza con una nueva capa de comodidad interactiva para los usuarios. Hasta ahora, Gemini solo describía imágenes. Ahora, al verlas, los usuarios pueden incluso hacer preguntas adicionales y mantener una conversación más detallada.

¿Cómo ayuda a los usuarios con dificultades de visión?

"La próxima vez que un amigo te envíe una foto de su nueva guitarra, podrás obtener una descripción y hacer preguntas adicionales sobre la marca y el color, o incluso sobre qué más hay en la imagen", dice Google. Esto se basa en la mejora de accesibilidad que integró Gemini en el sistema Talkback a finales del año pasado.

El menú Talkback en Android ahora incluye una función dedicada a la descripción de la pantalla que permite a Gemini tomar las riendas. Así, por ejemplo, si los usuarios están explorando un catálogo de ropa, Gemini no solo describirá lo que aparece en pantalla, sino que también responderá preguntas relevantes.

Por ejemplo, los usuarios pueden hacer preguntas como "¿Qué vestido sería el mejor para una salida nocturna fría de invierno?" o "¿Qué salsa combinaría mejor con un sándwich?". Gemini también podrá analizar toda la pantalla e informar a los usuarios sobre detalles del producto o si hay descuentos disponibles.

Cómo hacer que los subtítulos sean expresivos y mejorar el zoom del texto

En el navegador Chrome, Google está mejorando ligeramente los subtítulos generados automáticamente para los vídeos. Supongamos que estás viendo un partido de fútbol. Los subtítulos ya no solo seguirán las palabras del comentarista, sino que también reflejarán sus emociones y expresiones.

Por ejemplo, en lugar de "objetivo", los usuarios con problemas de audición verán un rotundo "gooooooal" para añadir un toque de énfasis emocional. Google los llama Subtítulos Expresivos.

Además del habla humana, ahora también cubrirán sonidos importantes como silbidos, vítores o incluso el simple carraspeo del orador. Los subtítulos expresivos estarán disponibles en todos los dispositivos con Android 15 o posterior, en EE. UU., Reino Unido, Canadá y Australia.

Otro cambio significativo que llega al navegador Chrome es el zoom de texto adaptativo, que es básicamente una actualización del sistema Page Zoom disponible en teléfonos Android. Ahora, al aumentar el tamaño del texto, no se verá afectado el diseño del resto de la página web.

"Puedes personalizar el nivel de zoom y aplicar fácilmente la preferencia a todas las páginas que visites o solo a algunas específicas", afirma Google. Los usuarios podrán ajustar el alcance del zoom mediante un control deslizante en la parte inferior de la página.