No se entusiasme demasiado con las funciones de inteligencia artificial del Samsung Galaxy S24

Una representación de un Samsung Galaxy S24 amarillo.
Arsène Lupin / X

"Una nueva era de IA móvil". Así es como Samsung está promocionando su próxima gama de teléfonos inteligentes de la serie Galaxy S24 . Para su evento Unpacked que tendrá lugar a finales de este mes, la compañía promete "una experiencia móvil completamente nueva impulsada por IA".

Samsung no será el primer nombre en sumergirse en el revuelo de la IA provocado por empresas como ChatGPT y Midjourney . Los dos pesos pesados ​​del silicio para teléfonos inteligentes, Qualcomm y MediaTek, recientemente hicieron un gran espectáculo sobre las capacidades de IA generativa en el dispositivo de sus últimos procesadores emblemáticos y de gama media.

El cambio es evidente. La IA será la palabra de moda en el marketing de teléfonos. Pero, ¿en qué nos espera exactamente? Sigue siendo un secreto cómo estos llamados “avances de la IA” agregarán algún valor significativo. O tal vez sea simplemente un truco existente que espera ser reempaquetado con un nombre diferente o una aplicación nativa.

Samsung puede entregar los productos o fallar espectacularmente

Avance de Galaxy AI de Samsung.
Más vale que esto no sea un truco, Samsung. Samsung

Comencemos con los teléfonos de la serie Galaxy S24. Se enviarán con el chip Snapdragon 8 Gen 3 de Qualcomm . El fabricante de chips está haciendo algunas afirmaciones audaces sobre las capacidades de IA generativa de su nuevo chipset de primer nivel. Por ejemplo, se dice que produce una imagen a partir de mensajes de texto en un segundo utilizando la tecnología Stable Diffusion AI .

Qualcomm ha ofrecido una explicación técnica fascinante de cómo optimizó la tecnología Stable Diffusion para el funcionamiento en el dispositivo. Su rival MediaTek también afirma que las funciones de IA en el dispositivo de su buque insignia Dimensity 9300 permitirán la generación de texto a imagen en menos de un segundo, cortesía de Stable Diffusion.

Ahora mismo ya tenemos un teléfono impulsado por el último buque insignia de Qualcomm. El dispositivo en cuestión es el iQoo 12 , pero es interesante ver que los materiales de marketing del teléfono no mencionan ningún truco de IA generativa, especialmente el que promocionan Qualcomm y MediaTek.

Supongamos que Samsung será el destinado a ofrecer esa función de generación de texto a imagen. ¿Qué va a lograr al final del día? En este momento, no sabemos si el truco de conversión de texto a imagen se incluirá en una aplicación de terceros o si Samsung lo integrará en una de sus aplicaciones.

La verdadera pregunta es cuánto valor agregará a nuestros patrones de uso diario de teléfonos inteligentes. ¿Qué hará un comprador promedio de Galaxy S24 con las imágenes generadas con una sola línea de texto? Quizás utilicen esas imágenes generadas por IA para agregar algo de entusiasmo a los chats o generar algo de revuelo en las redes sociales.

Pero todavía hay algunas fricciones aquí. Tendrás que generar estas imágenes a partir de una línea de texto, guardarlas localmente (o copiarlas directamente en el portapapeles) y luego pegar esas imágenes de IA en la aplicación de chat de tu elección. La solución más óptima sería si Samsung de alguna manera integrara el truco de generación de imagen a texto directamente en el teclado.

Demostración de difusión estable de Qualcomm para teléfonos.
Qualcomm

Una vez más, ¿por qué tomarse tantas molestias cuando los emojis, los GIF y las pegatinas pueden hacer el trabajo? Además, la salida de 512 x 512 píxeles no es una resolución suficiente para colocar estas imágenes generadas por IA en una tarea universitaria o una presentación de trabajo.

Además, es probable que el sistema no sea gratuito. El video de demostración de MediaTek menciona que hay una opción Premium sobre la mesa. Los compradores de Galaxy S24 podrían terminar encontrándose con un límite de tokens de texto a imagen cuando alcancen una cierta cantidad de salidas, después de lo cual se les degradará a un nivel de velocidad de generación de imágenes más lento o se les pedirá que paguen una tarifa de suscripción.

Pero si esa es la realidad, entonces el punto es discutible porque ya tenemos soluciones como Dall-E de OpenAI . Puede obtenerlo para generar imágenes de forma gratuita o pagar ChatGPT Plus para disfrutar de las ventajas de una generación de imágenes más rápida y detallada con el último modelo Dall-E 3. Este es sólo uno de los muchos generadores de texto a imagen que existen.

Qualcomm dice que el Snapdragon 8 Gen 3 es el "primero en admitir modelos multimodales Gen AI". Eso significa que el chatbot (basado en el modelo Llama de Meta) que se ejecuta de forma nativa en un teléfono aceptará entradas en forma de texto e imágenes, así como voz. Una vez más, esto no es único, ya que ChatGPT-4 ya ofrece esa capacidad, aunque detrás de un muro de suscripción.

¿Realmente lo necesitamos?

Asistente Snapdragon AI en teléfonos.
Qualcomm

Una de las características más prometedoras que anuncia Qualcomm es la expansión de imágenes mediante IA. Básicamente, puede expandir el lienzo de una imagen en cualquier dirección que desee, y la IA generativa del dispositivo generará píxeles de manera inteligente según su mensaje de texto y agregará más objetos al marco original.

Es sorprendente presenciar este truco: ver una imagen expandirse con la adición de más objetos y el horizonte ampliarse como si un maestro pintor estuviera retocando su obra. Pero no querrás hacerlo con las imágenes en las que haces clic en un teléfono para guardarlas como recuerdo. Usar la expansión de IA generativa en ellos es como contaminar tus recuerdos con imágenes y escenarios falsos que nunca experimentaste.

El resumen es otra gran apuesta para la implementación de IA generativa en dispositivos móviles. Es excelente para leer las noticias y mantenerse al tanto de los últimos desarrollos en diferentes dominios. Sin embargo, este truco sólo destacaría si la fricción es mínima. Por ejemplo, si los usuarios pueden resumir un artículo de noticias en la misma página del navegador en lugar de abrir otra aplicación.

Si este último es el caso, ¿por qué no simplemente cambiar a una aplicación que ya lo haga? Por ejemplo, Artifact es una aplicación increíblemente diseñada por el cofundador de Instagram, Kevin Systrom , que utiliza inteligencia artificial para resumir artículos.

Ya existen aplicaciones y sitios web que ofrecen noticias en forma de pepitas resumidas, como Inshorts. Para su bandeja de entrada, Shortwave es una aplicación excelente que puede hacer más que simplemente resumir cadenas de correo electrónico sin costo adicional.

Envío de resumen por correo electrónico en onda corta
Aplicaciones como Shortwave son excelentes para resumir sus cadenas de correo electrónico. Nadeem Sarwar / Tendencias digitales

La IA generativa en el dispositivo también promete trucos como la edición de fotografías basada en voz. Suena increíblemente útil, pero es difícil imaginar cuánta comodidad agregará a nuestras vidas cuando los filtros de un solo toque y los controles deslizantes granulares ofrezcan un flujo igualmente rápido y más gratificante para editar medios en los teléfonos.

A continuación, pasemos a la situación básica en torno al uso de la IA solo para iniciar algunos chats genéricos u obtener respuestas que de otro modo requerirían una investigación impulsada por Internet. Una vez más nos vamos a topar con problemas cualitativos.

Los modelos de IA generativa que se ejecutan de forma nativa en teléfonos, como Meta's Llama, no son los más avanzados de su tipo debido a la disponibilidad fundamental de recursos. No busques más allá de Google. El Pixel 8 Pro solo ejecuta el más pequeño de los modelos de lenguaje grande de Google llamado Gemini Nano . ¿Por qué no saltar a algo como ChatGPT o Pi a través de sus aplicaciones móviles dedicadas en lugar de conformarse con un modelo de lenguaje menos capaz?

Dónde realmente debe estar la IA generativa

Asistentes de IA comparados con ChatGPT.
Nadeem Sarwar / Tendencias digitales

En este momento, donde veo que la IA generativa está haciendo su mejor truco es en desacoplar las tareas de los teléfonos inteligentes de la nube (y el requisito de estar en línea todo el tiempo) y ofrecer un toque extra de seguridad. Pero para hacer eso, estos trucos de IA en el dispositivo deben funcionar como un asistente, algo así como el Asistente de Google, Alexa o Siri.

O mejor aún, deben convertirse en parte del asistente. Dile a tu asistente de IA generativa que recoja todas las imágenes de gatos de tu biblioteca, las teja en un collage y se las envíe a tu papá. O pídale que planifique el mejor itinerario para una excursión de un día a Disneyland, encuentre el boleto más barato para el próximo fin de semana y organice cuidadosamente todos esos detalles en Google Calendar.

Además, si una herramienta de IA generativa en el dispositivo ya no envía sus datos a los servidores en la nube y mantiene todas las operaciones localmente en su teléfono inteligente, hay poco de qué preocuparse por la privacidad de los datos. Al menos teóricamente, eso es. Por ahora, no estoy seguro de la visión de Galaxy AI que Samsung está vendiendo, pero sería interesante ver si Samsung realmente puede ofrecer experiencias significativas de IA generativa o simplemente un montón de trucos apenas prácticos y ingeniosos.