El futuro de la IA del iPhone se ha vuelto mucho más interesante

El módulo de cámara del Apple iPhone 15 Pro Max.
Apple iPhone 15 Pro Max Andy Boxall / Tendencias digitales

No hace mucho, se rumoreaba que Apple estaba trabajando internamente en algo llamado Apple GPT , un chatbot basado en el modelo de IA de la propia compañía con el objetivo de emular lo que hace ChatGPT de OpenAI . En los meses siguientes, hemos visto productos de IA generativa que aparecen en todas partes, desde Google Pixels y los teléfonos Galaxy S24 de Samsung hasta un advenedizo como el Nothing Phone 2a .

Mientras tanto, todo lo que obtuvimos de Apple fueron afirmaciones vagas pero audaces. El director ejecutivo de Apple, Tim Cook, dijo a los inversores que el impulso de la IA generativa de Apple “abrirá nuevos caminos” cuando llegue a finales de este año. Sin embargo, parece que Apple contará con la ayuda de Google para hacer realidad esos sueños. O tal vez incluso OpenAI venga al rescate.

Según Bloomberg , Apple está en conversaciones con Google para licenciar los modelos Gemini AI para iPhone. Suena como la misma estrategia que siguió Samsung para los teléfonos de la serie Galaxy S24 , que pueden ejecutar el modelo Gemini Nano de Google en el dispositivo, mientras que hay versiones más potentes disponibles en la nube.

Los términos del acuerdo aún no se han finalizado, ya que se dice que las discusiones están en constante cambio. Sin embargo, se informa que Apple también está en conversaciones con OpenAI. Para recordar, la tecnología básica de OpenAI, como el modelo GPT-4 y Dall-E, está actualmente disponible en todo el conjunto de productos de Microsoft y a través de aplicaciones y servicios independientes como ChatGPT Plus . Es un avance interesante en las ambiciones de IA de Apple, y uno que me tiene igualmente entusiasmado y preocupado.

El viaje de Apple a la IA (hasta ahora)

Cómo utilizar Gemini en su dispositivo basado en Android.
Tendencias digitales

En el último mes de 2023, sin mucha fanfarria,Apple presentó una serie de bibliotecas y marcos de modelos bajo el grupo MLX diseñados para operar en su silicio patentado. Este movimiento está preparado para introducir capacidades de IA generativa en la serie Mac, similar a los esfuerzos de Qualcomm con su plataforma Snapdragon X Elite.

A principios de este año, la división de investigación de Apple presentó un artículo sobre una herramienta de inteligencia artificial generativa llamada Keyframer , que permite a los usuarios producir contenido animado. Se basa fundamentalmente en el modelo GPT-4 de OpenAI, pero incorpora gráficos vectoriales para el procesamiento de imágenes fijas.

Además, los expertos de Apple también impulsaron un artículo de investigación que describe una herramienta de inteligencia artificial que facilita la edición de imágenes mediante simples instrucciones verbales. Esta característica se parece al conjunto de herramientas de edición de medios asistida por voz promocionado por los últimos chips Snapdragon de Qualcomm.

Aplicación ChatGPT ejecutándose en un iPhone.
Joe Maring / Tendencias digitales

Un informe posterior de Bloomberg destacó que Apple ha estado aumentando su equipo dedicado responsable de examinar las funcionalidades de IA generativa, con el gran objetivo de hacer que estas herramientas sean accesibles para los desarrolladores para 2024.

Se rumorea que el lote inaugural de funcionalidades de IA generativa de Apple debutará con iOS 18, cuya revelación está programada para junio. Pero según el último informe de Bloomberg, esas características están orientadas a sistemas nativos en el dispositivo y no a instalaciones de IA realmente generativas que generalmente están conectadas a la nube, como las proporcionadas por ChatGPT, Gemini o Perplexity.

En septiembre, The Information reveló que Apple ha estado desarrollando “modelos básicos” destinados a mejorar Siri. Esta iniciativa es supuestamente similar a cómo Gemini está avanzando con el Asistente de Google.

¿Qué podría hacer Gemini en los iPhone?

La aplicación Google Gemini en acción en Android.
Google

Ahora, Gemini aporta un montón de capacidades a un teléfono mientras se ejecuta localmente y cuando está conectado a Internet. Cuando se implementa en el dispositivo, como es el caso de Google Pixel 8 Pro , puede resumir conversaciones en la aplicación Grabadora incluso cuando el teléfono está desconectado.

Para las personas que ejecutan la aplicación de teclado Gboard, Gemini Nano trae Smart Reply a la mesa, comenzando con aplicaciones como WhatsApp. En pocas palabras, lee su conversación y, en consecuencia, sugiere respuestas basadas en el contexto. La IA en el dispositivo también agrega traducciones sin conexión, una función que ya se incluye en los teléfonos de la serie Samsung Galaxy S24 preparados para Gemini.

En este momento, con la aplicación Gemini instalada en un teléfono, puede realizar las siguientes tareas.

  • Al igual que el Asistente de Google o ChatGPT, puedes entablar conversaciones en lenguaje natural con Gemini y obtener ayuda para escribir, generar ideas y más.
  • Resuma rápidamente la información de sus correos electrónicos o archivos después de activar la extensión Workspace. La información se puede resumir en formatos como listas, gráficos y tablas.
  • Genere imágenes utilizando mensajes de texto al estilo del motor Dall-E de OpenAI.
  • Obtenga ayuda para usar su cámara de nuevas maneras. En la aplicación Gemini, apunta la cámara a una escena y pide a la IA información sobre los objetos en el encuadre.
  • Comprenda lo que hay en su pantalla. Invoca a Gemini con un comando "Hey Google" para realizar el trabajo. Por ejemplo, puede resumir el artículo que estás leyendo actualmente.
  • Utilice Google Maps y Google Flights para planificar viajes e incluso crear rutinas personalizadas.

Cómo podría desarrollarse un acuerdo de IA entre Apple y Google

Hablando con el chatbot Perplexity en Nothing Phone 2a.
Nadeem Sarwar / Tendencias digitales

Como se mencionó anteriormente, Samsung trabajó en estrecha colaboración con Google para que el modelo Gemini Nano AI se ejecutara en sus teléfonos insignia. Pero Gemini no se limita sólo a los buques insignia. En febrero de este año, MediaTek anunció que su silicio Dimensity 8300 de gama media ahora está optimizado para Google Gemini junto con el modelo insignia Dimensity 9300 .

Hacer algo similar para Apple no debería ser una gran molestia. Si un acuerdo de licencia para el dispositivo no funciona, siempre queda la ruta de la solicitud. Por ahora, no está claro qué estrategia implementará Apple, suponiendo que el acuerdo se lleve a cabo en primer lugar.

La pregunta más importante es si un acuerdo de licencia de Gemini cambiará significativamente la forma en que los usuarios interactúan con sus iPhones. Y lo que es más importante, ¿Géminis fomentará algún cambio para Siri? Para decirlo sin rodeos, Siri todavía tiene mucho camino por recorrer antes de poder alcanzar al Asistente de Google.

Siri en un iPhone.
Nadeem Sarwar / Tendencias digitales

Pero claro, ni siquiera Google ha descubierto dónde existe Gemini o reemplaza al Asistente de Google en su totalidad. En este momento, cuando instalas Gemini en un teléfono Android , reemplaza al Asistente de Google. O al menos eso intenta.

Su teléfono todavía depende del Asistente de Google para una amplia gama de tareas mundanas pero significativas, como hacer una llamada, configurar una alarma, enviar un mensaje, controlar dispositivos domésticos inteligentes y crear entradas en el calendario. De manera similar, para la navegación, la escritura por voz en Gboard y Android Auto, el Asistente de Google sigue siendo la IA confiable, no Gemini.

Además, el Asistente de Google sigue siendo el compañero de IA preferido en pantallas inteligentes y relojes inteligentes Wear OS. Teniendo en cuenta lo estrechamente que Apple entrelaza su software en el ecosistema de hardware, especialmente entre los iPhone y el Apple Watch, un enfoque escalonado en el que Gemini, Google Assistant y/o Siri asuman solo una parte de las responsabilidades creará mucha confusión para una empresa. usuario promedio.

Alternativamente, Apple podría trabajar en estrecha colaboración con Google y crear integraciones exclusivas, vinculando a Gemini con funciones del ecosistema de Apple como Siri, Mail, Notes, Safari, Calendar, Health y más. Sin embargo, dado el estado actual de las políticas de almacenamiento de datos de Gemini, no esperamos una integración tan estrecha a nivel de sistema.

Los riesgos de Géminis para Apple

Aplicación Google Gemini en Android.
Nadeem Sarwar / Tendencias digitales

Por supuesto, Apple se perdió la primera ola de IA generativa en los teléfonos inteligentes y, si hay que creer en los informes, la compañía está trabajando frenéticamente para ponerse al día. Pero un acuerdo de licencia de Gemini también significa que es posible que nunca veamos el trabajo de Apple con el desarrollo de IA generativa bajo el proyecto "Ajax". O tal vez solo lo veamos en forma diluida mientras Gemini hace el trabajo pesado de la IA en los iPhone.

Pero Géminis no está exento de defectos. Por el contrario, ha fallado más sorprendentemente que cualquier otra herramienta convencional de IA generativa. Hace unas semanas, los usuarios de Gemini notaron que estaba produciendo imágenes extremadamente inexactas, en particular con un mal manejo del tono de piel, el origen étnico y la precisión histórica.

La controversia aumentó hasta el punto de que Google detuvo la creación de texto a imagen para Gemini. "Para ser claros, eso es completamente inaceptable y nos equivocamos", escribió el director ejecutivo de Google, Sundar Pichai, en un memorando interno, del que informó NPR .

El logotipo de Google Gemini AI.
Google

Al otro lado del Atlántico, Gemini se vio envuelto en otra controversia cuando sus comentarios sobre el Primer Ministro de la India, Narendra, fueron considerados despectivos y se volvieron virales en las redes sociales. “Decir simplemente '… lo siento, no fue probado' no es consistente con nuestras expectativas de cumplimiento de la ley”, advirtió (a través de NDTV ) el Ministro de la Unión de la India, Rajeev Chandrasekhar.

La controversia una vez más puso la regulación de la IA en el debate y también se emitió un aviso para los principales actores de la IA, exigiéndoles obtener una aprobación explícita antes de que herramientas como Gemini se lancen públicamente.

Para una empresa que se muestra tan segura con las regulaciones gubernamentales como Apple, otorgar licencias a Gemini para cientos de millones de dispositivos en todo el mundo no es un riesgo menor. Especialmente cuando el propio Google advierte que “Gemini cometerá errores” y dice que siempre hay que comprobar si hay imprecisiones.