Según informes, Google está desarrollando una importante actualización para su asistente generativo de IA, Gemini , que podría transformarlo de ser principalmente un asistente conversacional a algo más parecido a un agente de trabajo real. En un reciente análisis beta del código de la aplicación de Google realizado por 9to5Google , los desarrolladores descubrieron cadenas que apuntaban a una función conocida internamente como "automatización de pantalla". Esto sugiere que Gemini pronto podría realizar acciones directas en tu nombre dentro de ciertas aplicaciones de Android, como realizar pedidos o reservar viajes, sin necesidad de que el usuario tenga que tocar manualmente las pantallas.
Si bien Gemini ya permite tareas conversacionales como redactar correos electrónicos o generar planes de investigación, esta actualización parece permitirle interactuar con las interfaces de las aplicaciones, pulsando botones y navegando por las pantallas para completar tareas que normalmente haría usted mismo. Las primeras pruebas de la versión beta sugieren que estas funciones se limitarán inicialmente a unas pocas aplicaciones compatibles y priorizarán la supervisión del usuario. Google advierte que "Gemini puede cometer errores" y que los usuarios son responsables de las acciones que se tomen en su nombre.
Cómo esta actualización convierte a la IA de asistente a agente
El concepto detrás de la automatización de pantallas es un gran paso para otorgar a la IA mayor autonomía en los flujos de trabajo digitales cotidianos. En lugar de simplemente sugerirte lo que puedes hacer, Gemini pronto podría ejecutar esas decisiones directamente dentro de las apps. Las primeras cadenas de código de la beta de Google también indican precauciones de privacidad, como recomendar a los usuarios no introducir información de inicio de sesión ni de pago en los chats de IA y advertir que las capturas de pantalla podrían revisarse para mejorar la función. Google ya ofrece algunas funciones de agente a través de su plataforma Gemini Agent en Workspace y la web, donde la IA puede gestionar flujos de trabajo complejos y coordinarse entre servicios. Sin embargo, la automatización de pantallas podría incorporar estas funciones directamente a los smartphones y al uso diario de apps.
Si estas funciones se implementan ampliamente, podrían marcar un cambio en la forma en que las personas interactúan con los dispositivos móviles, pasando de tocar y deslizar la pantalla por sí mismas a permitir que las herramientas de IA actúen en su nombre. Esto puede facilitar las rutinas diarias, pero también plantea interrogantes sobre el control, la seguridad y la supervisión, especialmente cuando la automatización afecta a tareas sensibles como las reservas o los pedidos financieros.
Según se informa, Google está posicionando estas actualizaciones como opcionales y supervisadas, lo que permite a los usuarios detener o anular Gemini en cualquier momento. Sin embargo, por ahora, la función de automatización de pantalla sigue en desarrollo y aún no está disponible en versiones estables.
La publicación Gemini de Google pronto podría trabajar por usted apareció primero en Digital Trends .
