Esta es la única función de IA de Google I/O 2024 que no puedo esperar para usar

Aplicación Google Photos en un Google Pixel 8 Pro.
Joe Maring / Tendencias digitales

El discurso de apertura principal de Google I/O 2024 estuvo repleto de un montón de nuevas funciones de inteligencia artificial que llegarán a computadoras de escritorio y dispositivos móviles, gracias a Gemini. Habrá nuevas formas de buscar en Google a través de videos y solicitudes de avisos multimodales, mientras que los teléfonos inteligentes eventualmente obtendrán superpoderes de inteligencia artificial a través de la cámara con el Proyecto Astra .

Pero hay una característica que realmente me llamó la atención: Preguntar fotos con Gemini en Google Photos.

Primero, ¿qué es Géminis?

Logotipo Géminis de Google con la IA ejecutándose en un teléfono inteligente y una PC.
Google

En primer lugar, ¿qué es Géminis ? Básicamente es la familia de modelos de inteligencia artificial de Google, que incluye Gemini Nano, Gemini Pro y Gemini Ultra. En resumen, es la versión de OpenAI de Google y sus propios modelos GPT, como ChatGPT .

Gemini puede comprender y generar texto como otros modelos de lenguaje grandes (LLM), como GPT de OpenAI. Sin embargo, Gemini puede hacer un poco más: comprende, opera y combina otras formas de información como imágenes, videos, audio e incluso código.

Para los teléfonos inteligentes Android , utiliza Gemini Nano , que opera localmente en el propio dispositivo. Gracias al modelo Gemini Nano , las funciones existentes como Circle to Search mejorarán aún más con la capacidad de ayudar a los estudiantes con las tareas de física y matemáticas.

También será aún más consciente del contexto de lo que hay actualmente en tu pantalla, ya que podrás hacerle preguntas a Gemini sobre un video que estás viendo o un PDF largo que estás navegando en lugar de desplazarte por docenas de páginas. Gemini Nano incluso traerá capacidades multimodales a su teléfono inteligente, como consultas de búsqueda con múltiples solicitudes en una.

El debut de Ask Photos de Google.
Google

Ask Photos with Gemini es una de las muchas funciones nuevas de Gemini anunciadas en I/O 2024 y estará en Google Photos a finales de este año. En pocas palabras, puede buscar en su enorme biblioteca de fotografías con un enfoque más conversacional en lugar de palabras clave.

En la demostración de Google I/O, Google demostró que puedes simplemente preguntar: "¿Cuál es mi matrícula?". o “¿Cuándo aprendió mi hija a nadar?” para mostrar fotos que respondan a esas solicitudes.

Incluso va un paso más allá con solicitudes como “Muéstrame cómo ha progresado la natación de mi hija”. Consultas como esta hacen que Géminis revise sus fotos por fecha y contexto para obtener un resultado apropiado.

Cuando se mostró Ask Photos with Gemini en el escenario, estaba emocionado y no puedo esperar a tenerlo en mis manos.

El compañero de IA de los padres

Samsung Galaxy S24 en Marble Grey que muestra Google Photos.
Christine Romero-Chan / Tendencias digitales

Solo soy mamá desde hace poco más de dos años. Pero en ese tiempo, he tomado más fotos que nunca porque me encanta capturar todos los pequeños momentos de mi hija, ya sea que sea linda y tonta o esos hitos importantes que quiero capturar en una foto o un video. Con un iPhone 15 Pro de 1 TB y los innumerables teléfonos Android que pruebo, siempre estoy tomando fotos de mi hija.

Quizás pienses que es excesivo, tal vez lo sea. Pero no tengo muchas fotos, y mucho menos videos, de mi infancia que me hayan proporcionado mis padres. Realmente no capturaron todos mis momentos especiales y solo tengo recuerdos vagos, nada muy detallado o específico. Con toda la tecnología que tenemos ahora, me ha ayudado a asegurarme de que mi hija tenga evidencia visual de su infancia.

Aunque tomo fotos y videos para compartir con familiares y amigos selectos, capturo principalmente estos momentos porque quiero recordarlos más tarde. Ya sea que esté buscando un estímulo rápido para hacerme sonreír o cuando soy una anciana senil y necesito un paseo por el camino de los recuerdos, reviso bastante mis recuerdos visuales.

Moto G 5G (2024) en Sage Green que muestra Google Photos.
Christine Romero-Chan / Tendencias digitales

Con Ask Photos with Gemini, no puedo esperar para pedirle que me muestre el progreso de mi hija en varios acontecimientos de la vida. Por ejemplo, la iniciaremos en preescolar este agosto. Me encantaría pedirle a Géminis que me muestre su progreso a lo largo de la escuela o simplemente que me muestre todos sus “primeros días” de cada año escolar. O cuando aprende a andar en bicicleta, puedo ver su progreso pasando de las ruedas de apoyo a una bicicleta completa. Diablos, Géminis podría incluso mostrarme cuándo mi hija apaga las velas de su pastel de cumpleaños todos los años.

Hay muchas posibilidades para utilizar Ask Photos, pero esas son sólo algunas ideas que me vienen a la mente. Y si bien es excelente para los padres por los hitos de sus hijos, también lo es para otras cosas. Me veo usándolo para mis aniversarios, días festivos e incluso para mis mascotas.

Claro, ahora podría revisar todas mis fotos y buscar caras y palabras clave. Pero Ask Photos with Gemini parece una forma mucho más sencilla, rápida y natural de hacerlo. Y cuando tienes una biblioteca de fotos de más de 50.000 fotos y vídeos, bueno, me vendría bien una forma más sencilla de buscar en ella.

No puedo esperar para usar esto

Demostración del Proyecto Astra en un teléfono.
Google

Ask Photos no es la única función de Gemini AI que Google mostró en Google I/O 2024. Y si bien es la que más me entusiasma por su practicidad, hay otras cosas interesantes que también quiero comprobar.

Por ejemplo, el Proyecto Astra parecía intrigante. A menudo uso mi teléfono para capturar una foto de algo que quiero guardar para más tarde y sobre lo que aprender más, como plantas y flores. Pero con Astra, tendrás esa bondad de la IA directamente en la cámara y podrá informarte sobre lo que estás mirando en tiempo real. Y aunque Google no anunció ninguna gafas inteligentes , el Proyecto Astra demostró que sería una característica increíble tenerla en las gafas inteligentes en algún momento.

También estoy bastante ansioso por comprobar las solicitudes de avisos multimodales en la Búsqueda de Google con tecnología Gemini. No soy el tipo de persona que disfruta planeando cualquier cosa, así que si Google puede hacer el trabajo por mí, entonces estoy totalmente de acuerdo. Y aunque no creo que las alertas de estafas en tiempo real sean muy útiles para mí (de todos modos, nunca contesto el teléfono), será una característica muy útil para otros.

Ask Photos with Gemini debería llegar a Google Photos a finales de este verano y no puedo esperar para probarlo.