Géminis está a punto de desplegar sus alas en tu teléfono con habilidades de agente.

El Google I/O está a la vuelta de la esquina, y ahora que Google ha concluido The Android Show , todas las miradas se centran en las ambiciones de la compañía en el campo de la IA, especialmente en Gemini . Aunque aún no se ha anunciado nada oficialmente, una nueva filtración nos da una idea de lo que Google podría estar preparando entre bastidores.

Es posible que tu bandeja de entrada pronto tema más a Géminis que al spam.

Según se informa, una publicación compartida por Waguri_Kaoruko8 en X muestra algo llamado "Modelo Gemini Spark", junto con un nuevo Modo Agente o Chat diseñado para acciones más avanzadas basadas en herramientas. Y, sinceramente, esto da la impresión de que Google está intentando convertir a Gemini en un asistente de IA propiamente dicho que se encargue de las tareas digitales tediosas.

La filtración fue posteriormente citada por la cuenta del catálogo de pruebas de AI News , que afirmaba que actualmente no parece haber soporte para importar archivos SKILL MD directamente. Aparentemente, los usuarios tendrán que recurrir al método tradicional de copiar y pegar por ahora. La publicación también menciona que aún no hay indicios de control del navegador ni de capacidades completas de uso de la computadora, dos características que muchos esperaban que llegaran a medida que los agentes de IA se volvieran más capaces. Pero las capturas de pantalla son donde la cosa se pone interesante.

Según la interfaz filtrada, el modelo Gemini Spark —actualmente en fase beta— parece centrarse en la automatización y la personalización. Una de sus funciones permite organizar la bandeja de entrada resumiendo boletines informativos, archivando correos innecesarios e incluso cancelando automáticamente la suscripción a listas de correo. Otra herramienta genera resúmenes de reuniones, recopilando información relevante y resúmenes rápidos antes de una llamada o cita importante. También incluye una función de resumen de noticias personalizado, diseñada para seguir las noticias que realmente te interesan, en lugar de bombardearte con titulares aleatorios durante todo el día.

En cierto modo, da la impresión de que Google está impulsando a Gemini para que se convierta en una capa de productividad en segundo plano, en lugar de una simple IA a la que se le hacen preguntas ocasionalmente. Y, francamente, probablemente sea la dirección más inteligente.

Google podría estar desarrollando un sistema de flujo de trabajo de IA de código abierto.

La filtración también sugiere que los usuarios podrían crear "habilidades" personalizadas para Gemini. Según se informa, el proceso de configuración consiste en asignar un título a la habilidad, explicar su función y añadir instrucciones sobre cómo debería comportarse Gemini. Es como crear pequeños flujos de trabajo de IA sin necesidad de programar.

Por supuesto, es importante mantener las expectativas bajo control. Nada de esto es oficial todavía, y las filtraciones durante la temporada de Google I/O suelen propagarse rápidamente. Aun así, el momento lo hace particularmente interesante. Dado que se espera que Google apueste todo por Gemini en el I/O la próxima semana, existe una posibilidad real de que veamos al menos algunas de estas funciones hacerse oficiales más pronto que tarde.