Todo lo anunciado en Google I/O 2024

Un presentador de Google IO muestra información sobre un nuevo proyecto de IA.
Google

Android, Wear OS y Pixel pueden ser los nombres conocidos de Google, pero fue Google Gemini , su tecnología de inteligencia artificial emergente, la que se robó la atención en Google I/O 2024 . La celebración anual del software de la compañía prepara el escenario para todo lo que la compañía ha planeado para el próximo año, y este año, el CEO Sundar Pichai declaró sin ambigüedades que Google está en su “era Géminis”. Desde búsquedas de IA en Google Photos hasta asistentes virtuales de IA que trabajarán junto a usted, Google está integrando a Gemini en absolutamente todo, y las implicaciones son enormes. Aquí hay una descripción general de todo lo que Google anunció este año.

adquisición de Géminis

El debut de Ask Photos de Google.
Google

Los usuarios suben más de 6 mil millones de fotos a Google Photos todos los días, por lo que no es de extrañar que nos vendría bien una mano para revisarlas todas. Gemini se agregará a Google Photos este verano, agregando capacidades de búsqueda adicionales a través de la función Preguntar fotos. Por ejemplo, pregúntele "¿Cuál es mi matrícula otra vez?" y buscará entre sus fotos para encontrar la respuesta más probable, lo que le ahorrará la necesidad de revisar manualmente sus fotos para encontrarlas usted mismo.

La Notebook LM, destacada en el Google I/O del año pasado, también incluirá Gemini, llevando su inteligencia artificial a niveles aún más altos. Durante la presentación, Google lo mostró enseñando cómo adaptar una lección de física usando el baloncesto como ejemplo. Es probable que este tipo de personalización del aprendizaje prevalezca a medida que avanzamos hacia el futuro.

Gemini 1.5 Pro estará disponible para todos los desarrolladores y usuarios avanzados a partir de hoy, en más de 35 idiomas.

Agentes Gemini pueden hacerlo por ti

Gemini no sirve sólo para hacer preguntas y resumir datos: Google quiere que también haga las cosas por usted. Si bien no puede aspirar ni sacar la basura por ti, Agents es un nuevo asistente de inteligencia artificial al que puedes asignar tareas. Google lo demostró tomando una foto de un par de zapatos y diciéndoles a los agentes que los devolvieran. Utilizó inteligencia artificial para identificar los zapatos, buscó el recibo en Gmail y se ofreció a iniciar una devolución por correo electrónico. También podría usarse para planificar vacaciones, viajes de trabajo y otras tareas relacionadas con la información.

Proyecto Astra

Demostración del Proyecto Astra en un teléfono.
Google

Otro proyecto experimental de Google es Astra , que conecta a Gemini con las cámaras y le permite comprender e interpretar el mundo que lo rodea. En la demostración que vimos, Astra pudo identificar un orador, desglosar qué parte del orador hacía ruidos, leer el código y explicarlo. Astra también podría usarse para agregar IA a un par de gafas inteligentes, lo que le permitirá hacer preguntas sobre las cosas que ve sin sostener la cámara del teléfono.

Esto no es algo que no hayamos visto antes (ChatGPT ha mostrado algo similar), pero es difícil decir que Astra no sigue siendo impresionante. Desafortunadamente, no hay un cronograma sobre cuándo es probable que se lance ni por cuánto.

IA generativa

La IA generativa es la IA más común que existe y Google no ignora este elemento más importante de la IA. Su modelo de IA más nuevo para crear imágenes se llama Imagen 3, y Google afirma que es el mejor modelo creado hasta ahora para crear imágenes con palabras, pero también para comprender indicaciones.

Donald Glover sentado en una cabina con un equipo de filmación.
Google

Más allá de las imágenes, Google ha estado trabajando arduamente en la creación de modelos de inteligencia artificial para generar música, y Veo, un modelo de inteligencia artificial que puede crear videos HD muy impresionantes. Las indicaciones se pueden usar para editar videos existentes, por lo que no es necesario recrear videos desde cero cada vez, y los ejemplos de video que se muestran definitivamente se ven mejor que la mayoría de los videos creados por IA. Google está prestando el poder de Veo a Donald Glover, quien está en el proceso de crear una película utilizando este nuevo modelo de IA.

¿Le preocupa que las imágenes, los sonidos y los vídeos generados se utilicen con fines nefastos? Google ha añadido SynthID a las creaciones de Gemini, una forma invisible de marca de agua para mostrar contenido creado por IA. Las herramientas de imagen y video se pueden encontrar en ImageFX y Video FX.

La IA generativa también aparecerá en las Búsquedas de Google. AI Overviews resumirá los resultados en la parte superior de su búsqueda, en lugar de enviarlo a varios sitios web. El razonamiento de varios pasos desglosará sus solicitudes y aprovechará los índices de Google para brindarle la información más relevante. Incluso puede ayudarte a planificar un viaje.

Uno de los elementos más impresionantes de AI Overview es la capacidad de usarlo para hacerle una pregunta durante Google Lens y obtener una descripción general personalizada y relevante que responda a la pregunta planteada. Las descripciones generales de IA estarán disponibles en todo Estados Unidos a partir de hoy.

Géminis y el espacio de trabajo

Gemini ha estado disponible en el Workspace de Google desde hace un tiempo, pero Google está listo para llevarlo al siguiente nivel. Un panel lateral impulsado por Gemini estará disponible el próximo mes. Gemini también llegará a Meet en más idiomas.

Y como era de esperar, Gemini se implementará en Gmail. Pídale que resuma información de la escuela de su hijo y podrá hacerlo, o simplemente resuma correos electrónicos largos para que usted no tenga que hacerlo. Escriba una pregunta o mensaje y Gemini podrá responderla por usted o realizar una acción. Por ejemplo, podrá reunir presupuestos separados para trabajos de construcción y agruparlos en una lista para usted. Las respuestas inteligentes también se actualizarán con Respuestas inteligentes contextuales. Estas capacidades se implementarán para los usuarios de Workspace Labs este verano.

Es posible que pronto usted también trabaje junto con la IA. Google mostró un "compañero de equipo de IA", llamado Chip, que estaba a cargo de monitorear los recursos del equipo. Chip estaba disponible para responder preguntas en chats en Google Workspace y era capaz de recordar cuándo se habían tomado decisiones y el progreso del proyecto específico mencionado.

La aplicación Géminis

Google Géminis en el teléfono inteligente.
Google

Efectivamente, un Asistente de Google actualizado, puede comunicarse con Gemini de la misma manera que lo haría con el Asistente de Google, incluido texto y voz, pero también podrá usar video y una forma más conversacional de hablarle, conocida como Géminis en vivo.

Gemini Gems son versiones más pequeñas y personalizadas de Gemini que se pueden especializar en varios nichos. Entonces, si usas Gemini de maneras específicas una y otra vez, puedes crear una Gema para ahorrar tiempo cuando la necesites una y otra vez. Por ejemplo, puedes personalizar una gema para que te cuente historias en el estilo que prefieras, en lugar de recurrir a un chatbot de IA genérico con las mismas indicaciones una y otra vez.

La aplicación Gemini es capaz de hacer una serie de cosas que espera de Gemini, incluida la posibilidad de planificar un viaje y establecer un itinerario. Esta función se implementará este verano.

IA y Android

Google Géminis en iOS y Android.
Google

Naturalmente, Google también incorporará Gemini a su sistema operativo móvil. Android será el primer sistema operativo móvil que incluirá un modelo de IA tan avanzado, y eso lo convierte en la plataforma elegida si eres un fanático de la IA.

Circle to Search fue la primera parte de esto que salió, pero este año, Google también agregará Gemini como su asistente de inteligencia artificial estándar en Android y agregará más funciones de inteligencia artificial bajo el capó.

Piense en Gemini en Android como si fuera el Asistente de Google con esteroides. Podrá comprender contextualmente el contenido de su pantalla, incluida la capacidad de encontrar resúmenes de videos de YouTube, crear imágenes para respuestas y responder cualquier pregunta que pueda tener, sin tener que abandonar la pantalla que está mirando.

La accesibilidad es una característica clave que ofrece la IA. La función Talkback existe desde hace un tiempo, pero ahora, gracias a Gemini, las imágenes se pueden describir en detalle, brindando a las personas con problemas de visión una manera más fácil de usar sus teléfonos. Y como Gemini está disponible en el dispositivo, es rápido y veloz.

Gemini también podrá ayudar a lidiar con personas que llaman spam y estafas. Gemini escuchará tus llamadas y te avisará cuando detecte actividad sospechosa y, como todo está en el dispositivo, la información no saldrá de tu teléfono. Sin embargo, esta característica aún se está modificando y no estará disponible por un tiempo todavía.