Apple está abriendo Siri para que elija modelos de IA, pero solo hay uno que me parece lógico.

Apple nos prometió una Siri más inteligente y capaz en la WWDC 2024. La propuesta fue convincente: una Siri que comprende tu contexto personal, examina tus mensajes y correos electrónicos, realiza acciones dentro de tus aplicaciones y evoluciona hasta convertirse en un verdadero asistente.

Dos años después, ese sueño sigue siendo solo eso, un sueño. Pero aquí está el detalle que podría cambiar el rumbo del asistente de Apple. Según los informes, Siri ya no está vinculado a una única inteligencia artificial . Apple lo está diseñando para que sea flexible, capaz de redirigir las solicitudes al modelo externo que mejor se adapte a sus necesidades.

Esto me hizo plantearme una pregunta. Si Siri puede usar cualquier IA , ¿cuál debería usar? Actualmente, el modelo externo predeterminado es ChatGPT. Pero yo diría que Gemini es la opción más lógica, y aquí les explico por qué.

Siri es un motor de búsqueda

Piensa en cómo usas Siri a diario. Preguntas por el tiempo. Preguntas por los restaurantes más cercanos. Le pides que busque información en internet. Una parte importante del uso de Siri consiste en búsquedas o consultas similares, y ninguna empresa en el mundo realiza búsquedas mejor que Google .

Google ha dedicado décadas a desarrollar el motor de búsqueda más potente, y esa experiencia ahora se integra directamente en Gemini . Cuando le haces una pregunta a Gemini , no solo recurre a un modelo de lenguaje, sino que extrae datos del índice web en tiempo real de Google, Google Maps, Google Shopping y mucho más.

Utilizar esa tecnología para potenciar la capacidad de búsqueda de Siri la llevará a nuevas cotas que ningún otro proveedor de gestión del lenguaje natural (LLM) puede igualar.

Apple prometió inteligencia personal, pero Gemini la está cumpliendo.

Uno de los temas más comentados del anuncio de Apple en la WWDC 2024 fue la inteligencia personal. Apple mostró cómo Siri extrae información contextual de todas las aplicaciones y responde preguntas como "¿Cuándo aterriza el vuelo de mi madre?" o "Muéstrame fotos de Stacy con su abrigo rosa de Nueva York".

La demostración fue realmente impresionante. Sin embargo, si le pido que me muestre una foto mía con una camiseta negra, me muestra fotos aleatorias de personas de internet con camisetas negras. No exagero al decir que la función de inteligencia personal de Siri ha sido un fracaso rotundo.

Mientras tanto, Gemini lanzó discretamente su propia función de Inteligencia Personal. Esta accede a tu Gmail, Calendario, Google Fotos, Drive y más para analizar tus datos personales y responder preguntas complejas sobre tu vida. No es perfecta, pero al menos funciona.

Eso es prácticamente lo mismo que Apple estaba mostrando como una futura función de Siri, solo que Gemini lo está haciendo hoy . Si Apple quiere acelerar la implementación de esas funciones para los usuarios, Gemini podría ser el atajo que necesita.

Géminis ya hace lo que Siri prometió.

Apple Intelligence implementa un modelo de IA compacto y potente en todas las aplicaciones del sistema, combinando el procesamiento en el dispositivo para garantizar la privacidad con la computación en la nube para las tareas más exigentes. El procesamiento en el dispositivo y la privacidad son los aspectos que distinguen a Apple de la competencia. Pero ahora no está sola.

Gemini Nano ya ofrece esta funcionalidad en dispositivos Pixel y Samsung Galaxy. Permite la creación de resúmenes sin conexión, respuestas inteligentes y funciones contextuales, todo ello sin necesidad de conexión a internet. En Pixel 9 y modelos posteriores, Gemini Nano es multimodal y puede procesar imágenes, textos e idiomas directamente en el dispositivo.

Apple está desarrollando soluciones basadas en lo que Google ya ha lanzado. En lugar de reinventar la rueda, usar la implementación existente de Nano de Gemini como base para las funciones de Siri en los dispositivos le ahorraría a Apple muchos dolores de cabeza y dinero.

El conjunto de herramientas creativas de Géminis está repleto de ellas.

Aquí es donde la cosa se pone realmente interesante. Gemini no es solo un modelo de texto. Viene con todo un ecosistema creativo que Apple podría aprovechar.

Veo genera vídeos con una resolución de hasta 1080p, con estilos cinematográficos y clips de más de un minuto. Lyria , de Google DeepMind, se encarga de la generación de música y audio. En cuanto a imágenes, Nano Banana (el servicio de generación de imágenes de Google) recibió recientemente una importante actualización, con una mejor representación del texto, mayor coherencia en los sujetos y compatibilidad con cualquier relación de aspecto.

Apple ha lanzado recientemente su propio Creator Studio , que ofrece a los usuarios acceso a herramientas creativas mediante una suscripción mensual fija. Si la compañía pretende competir seriamente con empresas como Adobe, necesita ofrecer capacidades generativas. Y resulta que Gemini ya cuenta con todas esas capacidades, por lo que integrarlo en la suite creativa de Apple sería una decisión lógica.

La asociación ya existe.

Este punto no se discute lo suficiente. Según se informa, Google paga a Apple alrededor de 20 mil millones de dólares al año para seguir siendo el motor de búsqueda predeterminado en Safari. Se trata de uno de los acuerdos de distribución más valiosos en la historia de la tecnología. La relación entre Apple y Google es profunda, de larga data y económicamente enorme para ambas compañías.

Extender esa relación, desde «Google impulsa la búsqueda de Safari» hasta «Gemini impulsa las funciones de IA de Siri», no supone un salto drástico. Es una evolución natural de una colaboración que controla la mitad de lo que ocurre cuando abres un navegador en tu iPhone.

¿Con qué modelo me quedaría?

Claude es excelente para la lectura de textos extensos y el razonamiento matizado. ChatGPT cuenta con un ecosistema enorme y herramientas de codificación y agentes robustas. Ambos funcionan de maravilla como especialistas elegidos por el usuario. Yo mismo uso Claude en mi ordenador.

Pero ¿como motor predeterminado de Siri? No son la opción adecuada. Gemini funciona a nivel del sistema operativo en dispositivos móviles, comprende búsquedas y contextos personales, se presenta en un formato Nano integrado en el dispositivo y se encuentra en el centro de la relación comercial más importante que Apple mantiene con cualquier empresa tecnológica.

Todos los elementos están presentes. No se trata de si Gemini podría potenciar una Siri más inteligente, sino de si Google y Apple lograrán un acuerdo mutuamente beneficioso. Y, a juzgar por los rumores, parece que ya estamos avanzando en esa dirección.