El nuevo modelo de IA Gemini 2.0 de Google está a punto de estar en todas partes

Menos de un año después del debut de Gemini 1.5 , la división DeepMind de Google regresó el miércoles para revelar el modelo de próxima generación de IA, Gemini 2.0. El nuevo modelo ofrece salida de imagen y audio nativa y "nos permitirá construir nuevos agentes de inteligencia artificial que nos acerquen a nuestra visión de un asistente universal", escribió la compañía en la publicación de su blog de anuncio .
A partir del miércoles, Gemini 2.0 está disponible en todos los niveles de suscripción, incluido el gratuito. Como nuevo modelo insignia de IA de Google, puede esperar verlo comenzar a impulsar funciones de IA en todo el ecosistema de la compañía en los próximos meses. Al igual que con el modelo o1 de OpenAI , el lanzamiento inicial de Gemini 2.0 no es la versión completa de la compañía, sino más bien una iteración de “vista previa experimental” más pequeña y menos capaz que se actualizará en Google Gemini en los próximos meses.
“Efectivamente”, dijo a The Verge el director ejecutivo de Google DeepMind, Demis Hassabis, “es tan bueno como lo es el modelo Pro actual. Por lo tanto, puede considerarlo como un nivel completamente mejor, con la misma rentabilidad, eficiencia de rendimiento y velocidad. Estamos muy contentos con eso”.
Google también está lanzando una versión ligera del modelo, denominada Gemini 2.0 Flash, para desarrolladores.
Con el lanzamiento de un modelo Gemini más capaz, Google avanza en su agenda de agentes de IA, que vería modelos más pequeños, diseñados específicamente, que tomarían acciones autónomas en nombre del usuario. Se espera que Gemini 2.o impulse significativamente los esfuerzos de Google para implementar su Proyecto Astra , que combina las capacidades de conversación de Gemini Live con análisis de imágenes y vídeo en tiempo real para proporcionar a los usuarios información sobre su entorno a través de una interfaz de gafas inteligentes.
Google también anunció el miércoles el lanzamiento del Proyecto Mariner , la respuesta de la compañía a la función de control informático de Anthropic . Esta extensión de Chrome es capaz de controlar una computadora de escritorio, incluidas pulsaciones de teclas y clics del mouse, de la misma manera que lo hacen los usuarios humanos. La compañía también está lanzando un asistente de codificación de IA llamado Jules que puede ayudar a los desarrolladores a encontrar y mejorar código complicado, así como una función de "Investigación profunda" que puede generar informes detallados sobre los temas que busca en Internet.
Deep Research, que parece cumplir la misma función que Perplextiy AI y ChatGPT Search, está actualmente disponible para los suscriptores de Gemini Advanced de habla inglesa. El sistema funciona generando primero un "plan de investigación de varios pasos", que envía al usuario para su aprobación antes de implementarlo.
Una vez que haya aprobado el plan, el agente de investigación realizará una búsqueda sobre el tema determinado y luego saltará a cualquier madriguera relevante que encuentre. Una vez que haya terminado la búsqueda, la IA regurgitará un informe sobre lo que encontró, incluidos los hallazgos clave y enlaces de citas donde encontró su información. Puede seleccionarlo en el menú desplegable de selección de modelo del chatbot en la parte superior de la página de inicio de Gemini.