Aquí están todos los anuncios de Gemini más importantes de Google I/O 2024

El director ejecutivo de Google, Sundar Pichai, en el escenario del Google I/O hablando sobre Géminis.
Google

Como era de esperar, la IA ocupa un lugar central en la conferencia de desarrolladores Google I/O de este año. La compañía acaba de presentar una versión más avanzada de Gemini 1.5 Pro, su poderosa suite de inteligencia artificial generativa. Disponible para desarrolladores a partir de hoy, Gemini 1.5 Pro es un modelo de lenguaje multimodal que puede funcionar con texto, voz y varios formatos de contenido.

Las últimas actualizaciones de Gemini 1.5 Pro introducen una ventana contextual ampliada, funciones mejoradas de análisis de datos, integraciones con aplicaciones adicionales de Google y mayores opciones de personalización. También hay mejoras en casos de uso cruciales, como traducción, codificación, razonamiento y más.

Géminis 1.5 Flash

Características clave de Gemini 1.5 Flash.
Google

Google también presentó Gemini 1.5 Flash, que es un modelo más pequeño que ha sido optimizado para tareas más estrechas o de alta frecuencia donde la velocidad y el tiempo de respuesta son lo más importante.

Tanto 1.5 Pro como 1.5 Flash ahora admitirán una ventana de contexto de 1 millón de tokens, y Google también tiene planes de expandirla a 2 millones en 1.5 Pro. Ambos modelos ahora están disponibles para usuarios de 200 países como vista previa y se espera un lanzamiento general en junio.

Ventana contextual más larga

Escenario Google I/O con una diapositiva en pantalla hablando de Géminis.
Google

Una de las capacidades más destacadas de Gemini 1.5 Pro es la ventana de contexto mejorada de 1 millón de tokens, que se dice que es la más larga de todos los chatbots de consumo del mundo. Lo que eso significa es que la IA ahora puede comprender numerosos documentos de gran tamaño, hasta 1500 páginas o resumir aproximadamente 100 correos electrónicos. Con el tiempo, también tendrá la capacidad de procesar una hora de contenido de vídeo o bases de código que superen las 30.000 líneas.

Google también anunció que incluso pretendía alcanzar una ventana de contexto de 2 millones de tokens para finales de este año, ampliando aún más las capacidades de la IA.

Géminis en vivo

Google hace una demostración de Gemini Live.
Google

Para que el modelo de IA parezca más natural e intuitivo, Gemini obtendrá una nueva función Live que le permitirá tener una experiencia de conversación más mejorada. No sólo puedes hablar con Géminis y hacerle consultas, sino que también puede reaccionar a una variedad de sonidos en tu entorno.

Como ejemplo, puede utilizar la función En vivo dentro de Gemini para ayudar en una entrevista preparándose y ensayando con usted y sugiriendo habilidades clave para enfatizar durante la entrevista. Además, las próximas funciones permitirán a Gemini utilizar su cámara durante las sesiones en vivo, facilitando las discusiones sobre su entorno.

Integración más profunda con aplicaciones

Una captura de pantalla de Google I/O que muestra a un compañero de equipo de IA al lado del presentador.
Google

Gemini 1.5 Pro también se centrará en mejorar el chatbot de IA para que funcione como un asistente digital versátil que sea específicamente experto en gestionar las tareas diarias. Para hacerlo, Google está integrando Gemini con Google Calendar, Tasks y Keep, que se implementará pronto a través de extensiones introducidas en la plataforma Bard el año pasado.

Esto ayudará a los usuarios a realizar acciones sin problemas, como resumir correos electrónicos en Gmail, acceder a Google Docs o Drive e incluso cargar imágenes para tareas como agregar eventos a Google Calendar o elementos a una lista de compras en Google Keep. Las capacidades multimodales de Gemini y las funcionalidades propuestas, como reconocer listas de eventos escolares a partir de fotografías o compilar ingredientes de recetas en listas de compras, ofrecen un enfoque simplificado para organizar las responsabilidades diarias.

Google incluso anunció una nueva función AI Teammates para usuarios de Workspace que le permite implementar compañeros de trabajo virtuales en su empresa u organización.

Gemas personalizadas

Una captura de pantalla de Google I/O con una diapositiva en la pantalla sobre Gemas.
Google

Los suscriptores de Gemini Advanced pronto tendrán la opción de crear Gems, una versión personalizada de Gemini para una interacción más personalizada. Ya sea que necesite un compañero mientras hace ejercicio, un asistente de cocina, un colaborador de codificación o un mentor de escritura, Gems se puede personalizar según sus preferencias.

Simplemente describiendo las tareas y las respuestas deseadas, Gemini refinará sus instrucciones con un solo clic, creando una Gema que satisfaga sus necesidades únicas.

Gemini tocó casi todos los anuncios de la conferencia magistral, incluidas las actualizaciones de Android , Búsqueda, Gmail , Google Lens , Google Photos y más.