Lanzamiento de GPT-5: seis veces dije “wow”, pero tres veces “hmmmm”

El equipo de OpenAI, liderado por Sam Altman, finalmente presentó GPT-5, con cerca de 600.000 personas viendo la transmisión en vivo del lanzamiento, ya sea en directo o durante las tres primeras horas posteriores ( y tú también puedes verla si te la perdiste). Si bien esto va por detrás de ciertas imágenes espaciales y eventos de la Copa del Mundo, la audiencia muestra un gran interés en la nueva versión de ChatGPT. YouTube no ha sido muy transparente con los datos de audiencia, pero solo dos o tres eventos de Apple han tenido una audiencia significativamente mayor.

Probé GPT-5 antes del lanzamiento y se anunció prácticamente todo lo que esperábamos. A continuación, hablaré sobre lo que me sorprendió/impresionó y lo que me dejó perplejo.

¡Guau! #1. Han recorrido un largo camino en dos años y medio.

Muchos escritores, incluyéndome a mí, nos hemos quejado de alucinaciones, errores y otros fallos. Todo cierto. Pero también debemos tomarnos un respiro y reconocer el tremendo progreso que OpenAI ha logrado desde la primera versión pública de ChatGPT. Esa versión era más un juguete que una herramienta. Las versiones disponibles actualmente (4.0, 4.1 y 4.5) son muy potentes y más útiles. Si GPT-5 cumple incluso la mitad de las promesas que hicieron hoy, representará un gran avance. Wow 1.5 llegó cuando Sam Altman dijo que ahora tienen 700 millones de usuarios. Aplaudo su ambición y me recuerda una cita de Leo Burnett (quien está en el Monte Rushmore de la publicidad): « Cuando intentas alcanzar las estrellas, puede que no lo consigas, pero tampoco te saldrá un puñado de barro». OpenAI claramente está alcanzando las estrellas.

¡Guau! #2: Están cerrando los modelos antiguos y moviendo a todos a GPT-5

Si mirabas el menú en la parte superior de la página de ChatGPT antes del lanzamiento, verías múltiples opciones para los diferentes modelos. Había una o dos palabras sobre la función de cada modelo. Siempre fue confuso, al menos para mí. Ahora están migrando a todos a GPT-5 y cerrando los modelos anteriores. Este gráfico resume las diferencias entre GPT-4 y GPT-5. Altman dijo que si GPT-3 era un estudiante de secundaria y GPT-4 era un estudiante universitario, GPT-5 funcionará a nivel de doctorado. Esta versión estará disponible pronto para todos los usuarios comerciales (empresas y educación más adelante). Los usuarios gratuitos tendrán un límite de uso y se les cambiará a un modelo menos potente cuando superen el límite.

Característica GPT-4 GPT-5 (Esperado)
Capacidad de razonamiento Lagunas lógicas fuertes y ocasionales Razonamiento cercano al nivel de doctorado
Multimodalidad Texto, imágenes, voz Texto, imágenes, voz, vídeo.
Memoria de contexto Hasta ~128k tokens Hasta ~1 millón de tokens
Autonomía del agente Limitado, necesita aportes frecuentes Tareas más independientes y de varios pasos
Opciones de velocidad Un modelo principal Versiones Flagship, Mini y Nano
Apoyo de los medios Sin soporte de video Comprensión y generación de video completo

Wow #3: Menos alucinaciones

OpenAI enfatizó que GPT-5 pasará menos tiempo en Fantasyland que las versiones anteriores. Es una buena noticia, suponiendo que sea cierta. Mencionaron mejoras porcentuales, pero no mostraron su trabajo. Mi intuición me dice que será direccionalmente (y probablemente significativamente) mejor, pero aún no perfecto.

¡Guau #4! Integración de voz mucho más fuerte

Algunas personas han usado la voz para acceder a ChatGPT en versiones anteriores. Es evidente que se ha hecho un gran esfuerzo para equiparar la voz con la entrada de texto. Aún no tengo claro qué porcentaje de su uso representará esto, pero sin duda es una excelente opción. Mi escepticismo se basa, en parte, en un optimismo excesivo sobre la rapidez con la que Alexa revolucionaría el comercio de Amazon. Imaginé un mundo donde la gente en la cocina pediría la compra mientras cocina, pero no lo he visto. Escribir podría seguir siendo el método de entrada preferido para muchos.

Wow #5: Desarrollo de código más potente

Esto se incluirá en ambas categorías. Intentaron demostrar lo fácil que es desarrollar aplicaciones web con GPT-5. Un compañero "desarrolló" una aplicación para enseñarle a su novia a hablar francés con su familia. Funcionó más o menos, pero parecía un proyecto de clase de secundaria. Afirman que los programadores prefieren trabajar con GPT-5, pero no mostraron su trabajo ni las fuentes. También mostraron cómo GPT-5 podría ayudar con la depuración. Esto se podría clasificar como "genial si realmente se hace".

Wow #6: Grandes avances contra los malos actores

Primero, no hacer daño. Parece que OpenAI se toma en serio sus responsabilidades con la sociedad. Se debatió cómo respondería GPT-5 a búsquedas problemáticas. Esto proporcionará más contexto sobre por qué algo es incorrecto, poco ético o peligroso. A esto lo llaman "finalización segura". Merecerá la pena seguir monitorizándolo con el tiempo.

Hmmm #1: Esto parecía una presentación de clase, no un lanzamiento de producto de una gran empresa.

Quizás Apple y otros nos han malcriado, pero la presentación en sí fue bastante amateur. Hicieron subir y bajar del escenario a gente nerviosa del producto en segmentos de tres minutos. Muchos de los "chistes" resultaron improvisados y torpes. Sé que se trata del producto, no del empaque, pero parece que ya es hora de que mejoren su juego.

Hmmm #2: Necesitan ayuda para traducir su entusiasmo y pensamientos al inglés.

Un ejemplo muy interesante mostró cómo un padre podría ayudar a su hijo de secundaria con un informe de ciencias sobre el efecto Bernoulli. Hasta ahí, todo bien. La presentadora preguntó: "¿No sería genial tener una animación que mostrara esto?". ¡Sí! Y, si hubiera seguido explicándolo en términos sencillos, habría sido genial. En lugar de eso, dijo: "Crea un SVG con Canva" y mostró un montón de código Python. Aún hay una oportunidad para que el potencial de ChatGPT 5.0 sea más accesible para el usuario promedio, pero necesita ser accesible a ese nivel.

Hmmm #3: Afirman haber adelantado la evolución de la IA dos o tres años.

Uno de los científicos líderes en IA es Daniel Kokotajlo . Fue ingeniero de alto nivel en OpenAI antes de dejarlo. También es el autor principal de AI 2027 , un estudio muy bien documentado y razonado sobre el camino del desarrollo de la IA. Según dicho artículo, la IA tardará dos o tres años en realmente realizar el trabajo de un desarrollador. OpenAI prácticamente afirmó que están encaminados hacia esa meta con GPT-5. No estoy seguro de creerlo. De nuevo, quizás sea direccional. ¿Totalmente listo? No hasta que vea más.