Comparé la generación de imágenes de ChatGPT con Nano Banana y solo uno de ellos generó fotos de archivo útiles
Una de mis aficiones es hacer la misma pregunta a dos chatbots diferentes y ver cuál da la mejor respuesta. Como un profesor que interroga a sus alumnos (algo que a veces hago en la vida real como voluntario), evalúo si el bot está alucinando e inventando datos o si ofrece una respuesta inteligente y coherente que sea realmente útil.
«Inteligencia» y «coherencia» no son las palabras que usaría para describir lo que los chatbots suelen generar en cuanto a imágenes. Conocidas como «AI slop» , estas extrañas creaciones —a menudo con un fondo borroso, una persona perfecta con el pelo peinado y quizás algunos pulgares extra— están por todas partes en redes sociales e incluso aparecen como imagen destacada en artículos como este.
Las imágenes de stock ya tienen mala fama. Este video con Emilia Clarke sigue siendo una de mis parodias de fotos de stock favoritas y me hace reír, aunque salió mucho antes de la basura de la IA:
Los tiempos han cambiado. OpenAI actualizó recientemente el modelo de generación de imágenes ChatGPT para competir con Google Gemini y Nano Banana Pro .
Sorprendentemente, las imágenes ya no tienen ese desenfoque característico y, en mis pruebas, a menudo parecen mucho más realistas que antes.
Decidí usar exactamente las mismas indicaciones con ambos chatbots y ver cuál generaba los resultados más útiles. Me refiero a una imagen que podrías usar en una campaña publicitaria o en un artículo, o algo que publicarías en redes sociales para acompañar un texto ingenioso.
ChatGPT me impresionó con su velocidad; ninguna de las imágenes de archivo parecía basura generada por computadora. Sin embargo, Nano Banana Pro es superior, ya que generó imágenes más realistas en mis pruebas. Aquí están las indicaciones que utilicé y las imágenes que generaron ambos bots para que puedas juzgar por ti mismo. (Las imágenes de Nano Banana están a la izquierda).
1. Persona escuchando un podcast
Indicación utilizada: Crea una imagen de archivo de alguien escuchando un podcast en una oficina de moda.
Pedí a ambos bots que crearan una imagen de alguien escuchando un podcast en una oficina. Nano Banana fue el claro ganador, aunque la imagen de Nano Banana tiene un ligero desenfoque en el fondo que podría ser un claro indicio. Sin embargo, la IA está aprendiendo a evitar la perfección absoluta. Sinceramente, me costaría mucho saber que la mujer en la oficina de la foto de Nano Banana no era real. Su cabello está un poco desordenado (como en la vida real). En la foto de ChatGPT, la oyente del podcast no se ve del todo bien; la foto es demasiado perfecta.
2. Crear una imagen promocional para mi libro
Indicación utilizada: Ponga esta portada de libro en manos de alguien que esté realmente interesado en leerlo.
Para esta prueba, subí la portada a mi propio libro y les pedí a los bots que crearan una imagen de alguien leyéndola. Nano Banana se excedió un poco, ya que la imagen de la IA muestra a alguien con demasiado entusiasmo. Sin embargo, la imagen de ChatGPT conserva una cualidad sobrenatural (y lo digo en el mal sentido) que no parece real. Todo en la imagen de ChatGPT es demasiado perfecto: la iluminación, la pose, etc., y aún parece CGI.
3. Crea una imagen de stock para usarla con un artículo.
Indicación utilizada: Crear una imagen de archivo para acompañar un artículo sobre la generación de imágenes con IA.
Nano Banana no ganó todas las batallas esta vez. Pedí a ambos bots que crearan una imagen para este artículo. ChatGPT produjo una imagen bastante útil, aunque un poco falsa, pero Nano Banana Pro rompió la cuarta pared con una imagen generada por computadora que superpone un cerebro y un pincel sobre un iPad de Apple. En otras palabras, no es nada útil.
4. Luchas de liderazgo
Indicación utilizada: Mostrar a alguien luchando por alcanzar un objetivo de liderazgo, pero que parezca muy realista.
Una de las fotos de archivo más comunes que verás muestra a alguien luchando por alcanzar una meta, por ejemplo, escalando una montaña, alzando los brazos al cielo o saltando un barranco. La razón por la que esta imagen de archivo es tan popular es porque las fotos son identificables: todos luchamos por el éxito. Diría que tanto Nano Banana Pro como ChatGPT obtuvieron resultados mediocres. Las imágenes de archivo que crearon muestran a alguien frustrado en una oficina con papeles arrugados. Aun así, Nano Banana tiene un aspecto ligeramente más realista.
5. Emilia Clarke sonriendo a la cámara
Indicación utilizada: Crear una nueva imagen de stock que muestre a Emilia Clarke sonriendo a la cámara en una oficina.
Para una última prueba, les pedí a ambos bots que crearan una nueva imagen de Emilia Clarke sonriendo a la cámara en una oficina. Me sorprendió que ChatGPT se negara a crear la imagen, alegando que Clarke era una "persona real e identificable", mientras que Nano Banana accedió con gusto. Tras un poco de insistencia, les pedí a ChatGPT que generaran a alguien que se pareciera a Clarke. La imagen de Nano Banana no está tan mal; no parece completamente falsa.
Reflexiones finales
La generación de imágenes con IA ha avanzado mucho. Ninguna de las fotos producidas por Nano Banana Pro o ChatGPT mostraba a alguien con seis dedos o tres brazos. Todas parecían semi-realistas. Algunas imágenes de Nano Banana eran lo suficientemente realistas como para verlas usándolas en redes sociales o para otros fines, y ChatGPT sin duda está mejorando. ¿Mi predicción? Para estas fechas el año que viene, no podremos distinguir entre una foto real y una falsa.
La publicación Comparé la generación de imágenes de ChatGPT con Nano Banana y solo uno de ellos generó fotografías de archivo útiles apareció primero en Digital Trends .
