GPT-4: todo lo que necesitas saber sobre el modelo de IA estándar de ChatGPT

La gente quedó asombrada cuando salió ChatGPT , impresionada por sus capacidades de lenguaje natural como un chatbot de IA originalmente impulsado por el modelo de lenguaje grande GPT-3.5. Pero cuando salió el tan esperado modelo de lenguaje grande GPT-4, dejó al descubierto lo que pensábamos que era posible con la IA, y algunos lo llamaron los primeros destellos de AGI (inteligencia general artificial) .

¿Qué es GPT-4?

GPT-4 es el modelo de lenguaje más nuevo creado por OpenAI que puede generar texto similar al habla humana. Avanza en la tecnología utilizada por ChatGPT, que anteriormente se basaba en GPT-3.5 pero que desde entonces se ha actualizado. GPT es el acrónimo de Generative Pre-trained Transformer, una tecnología de aprendizaje profundo que utiliza redes neuronales artificiales para escribir como un humano.

Según OpenAI, este modelo de lenguaje de próxima generación es más avanzado que ChatGPT en tres áreas clave: creatividad, información visual y contexto más amplio. En términos de creatividad, OpenAI dice que GPT-4 es mucho mejor tanto para crear como para colaborar con usuarios en proyectos creativos. Ejemplos de estos incluyen música, guiones, escritura técnica e incluso "aprender el estilo de escritura de un usuario".

El contexto más amplio también influye en esto. GPT-4 ahora puede procesar hasta 128.000 tokens de texto del usuario. Incluso puede enviar a GPT-4 un enlace web y pedirle que interactúe con el texto de esa página. OpenAI dice que esto puede ser útil para la creación de contenido de formato largo, así como para "conversaciones extendidas".

GPT-4 ahora también puede recibir imágenes como base para la interacción. En el ejemplo proporcionado en el sitio web de GPT-4, al chatbot se le proporciona una imagen de algunos ingredientes para hornear y se le pregunta qué se puede hacer con ellos. Actualmente no se sabe si el vídeo también se puede utilizar de esta misma forma.

Imagen utilizada con permiso del titular de los derechos de autor.

Por último, OpenAI también dice que GPT-4 es significativamente más seguro de usar que la generación anterior. Según se informa, puede producir un 40% más de respuestas objetivas en las pruebas internas de OpenAI, y al mismo tiempo tiene un 82% menos de probabilidades de "responder a solicitudes de contenido no permitido".

OpenAI dice que ha sido capacitado con comentarios humanos para lograr estos avances, afirmando haber trabajado con "más de 50 expertos para obtener comentarios tempranos en dominios que incluyen la seguridad de la IA".

En las primeras semanas después de su lanzamiento, los usuarios publicaron algunas de las cosas increíbles que habían hecho con él , incluida la invención de nuevos lenguajes, detalles sobre cómo escapar al mundo real y la creación de animaciones complejas para aplicaciones desde cero. Al parecer, un usuario hizo que GPT-4 creara una versión funcional de Pong en sólo sesenta segundos, utilizando una combinación de HTML y JavaScript.

Cómo utilizar GPT-4

Bing Chat mostrado en una computadora portátil.
Jacob Roach / Tendencias digitales

GPT-4 está disponible para todos los usuarios en todos los niveles de suscripción que ofrece OpenAI. Los usuarios del nivel gratuito tendrán acceso limitado al modelo GPT-4 completo (~80 chats en un período de 3 horas) antes de ser cambiados al GPT-4o mini, más pequeño y menos capaz, hasta que se reinicie el temporizador de enfriamiento. Para obtener acceso adicional a GPT-4, además de poder generar imágenes con Dall-E, es necesario actualizar a ChatGPT Plus. Para pasar a la suscripción paga de $20, simplemente haga clic en "Actualizar a Plus" en la barra lateral de ChatGPT. Una vez que haya ingresado la información de su tarjeta de crédito, podrá alternar entre GPT-4 y versiones anteriores del LLM.

Si no quiere pagar, existen otras formas de probar lo poderoso que es GPT-4. En primer lugar, puedes probarlo como parte de Bing Chat de Microsoft. Microsoft reveló que ha estado usando GPT-4 en Bing Chat, que es de uso completamente gratuito. Sin embargo, algunas características de GPT-4 faltan en Bing Chat y claramente se ha combinado con algunas de las tecnologías patentadas de Microsoft. Pero aún tendrá acceso a ese LLM (modelo de lenguaje grande) ampliado y a la inteligencia avanzada que lo acompaña. Cabe señalar que si bien Bing Chat es gratuito, está limitado a 15 chats por sesión y 150 sesiones por día.

Hay muchas otras aplicaciones que actualmente también utilizan GPT-4 , como el sitio de respuesta a preguntas Quora.

¿Cuándo se lanzó GPT-4?

Una computadora portátil se abrió en el sitio web ChatGPT.
Shutterstock

GPT-4 se anunció oficialmente el 13 de marzo, como lo confirmó Microsoft con anticipación , y estuvo disponible por primera vez para los usuarios a través de una suscripción ChatGPT-Plus y Microsoft Copilot. GPT-4 también está disponible como API "para que los desarrolladores creen aplicaciones y servicios". Algunas de las empresas que ya han integrado GPT-4 incluyen Duolingo, Be My Eyes, Stripe y Khan Academy. La primera demostración pública de GPT-4 se transmitió en vivo en YouTube, mostrando sus nuevas capacidades.

¿Qué es el GPT-4o mini?

GPT-4o mini es la versión más reciente de la línea de modelos GPT-4 de OpenAI. Es una versión optimizada del modelo GPT-4o más grande que se adapta mejor a tareas simples pero de gran volumen que se benefician más de una velocidad de inferencia rápida que de aprovechar la potencia de todo el modelo.

GPT-4o mini se lanzó en julio de 2024 y reemplazó a GPT-3.5 como modelo predeterminado con el que interactúan los usuarios en ChatGPT una vez que alcanzan su límite de tres horas de consultas con GPT-4o . Según los datos de Artificial Analysis , 4o mini supera significativamente a modelos pequeños de tamaño similar como Gemini 1.5 Flash de Google y Claude 3 Haiku de Anthropic en el punto de referencia de razonamiento MMLU.

¿Es GPT-4 mejor que GPT-3.5?

La versión gratuita de ChatGPT se basó originalmente en el modelo GPT 3.5; sin embargo, a partir de julio de 2024, ChatGPT ahora se ejecuta en GPT-4o mini. Esta versión simplificada del modelo GPT-4o más grande es mucho mejor que incluso el GPT-3.5 Turbo. Puede comprender y responder a más entradas, cuenta con más salvaguardas, proporciona respuestas más concisas y su funcionamiento es un 60% menos costoso .

La API GPT-4

Como se mencionó, GPT-4 está disponible como API para los desarrolladores que hayan realizado al menos un pago exitoso a OpenAI en el pasado. La compañía ofrece varias versiones de GPT-4 para que los desarrolladores las utilicen a través de su API, junto con los modelos GPT-3.5 heredados. Al lanzar GPT-4o mini , OpenAI señaló que GPT-3.5 seguirá estando disponible para que lo utilicen los desarrolladores, aunque eventualmente se desconectará. La compañía no fijó un cronograma sobre cuándo esto podría suceder realmente.

La API se centra principalmente en los desarrolladores que crean nuevas aplicaciones, pero también ha causado cierta confusión entre los consumidores. Plex le permite integrar ChatGPT en el reproductor de música Plexamp del servicio, que requiere una clave API ChatGPT. Esta es una compra separada de ChatGPT Plus, por lo que deberá registrarse para obtener una cuenta de desarrollador para obtener acceso a la API si lo desea.

¿GPT-4 está empeorando?

Por mucho que GPT-4 impresionó a la gente cuando se lanzó por primera vez, algunos usuarios han notado una degradación en sus respuestas durante los meses siguientes. Figuras importantes de la comunidad de desarrolladores lo han notado e incluso se ha publicado directamente en los foros de OpenAI. Sin embargo, todo fue anecdótico y un ejecutivo de OpenAI incluso recurrió a Twitter para disuadir la premisa. Según OpenAI, todo está en nuestra cabeza.

Luego, se publicó un estudio que demostró que, efectivamente, la calidad de las respuestas empeoraba con futuras actualizaciones del modelo. Al comparar GPT-4 entre los meses de marzo y junio, los investigadores pudieron determinar que GPT-4 pasó del 97,6% de precisión al 2,4%.

No es una prueba irrefutable, pero ciertamente parece que lo que los usuarios están notando no es sólo una imaginación.

¿Dónde está la entrada visual en GPT-4?

Una de las características más esperadas de GPT-4 es la entrada visual, que permite a ChatGPT Plus interactuar con imágenes, no solo con texto, lo que hace que el modelo sea verdaderamente multimodal. Cargar imágenes para que GPT-4 las analice y manipule es tan fácil como cargar documentos: simplemente haga clic en el ícono del clip a la izquierda de la ventana contextual, seleccione la fuente de la imagen y adjunte la imagen a su mensaje.

¿Cuáles son las limitaciones de GPT-4?

Mientras analiza las nuevas capacidades de GPT-4, OpenAI también señala algunas de las limitaciones del nuevo modelo de lenguaje. Al igual que las versiones anteriores de GPT, OpenAI dice que el último modelo todavía tiene problemas con "sesgos sociales, alucinaciones e indicaciones adversas".

En otras palabras, no es perfecto. Seguirá recibiendo respuestas incorrectas y se han mostrado muchos ejemplos en línea que demuestran sus limitaciones. Pero OpenAI dice que todos estos son problemas para los que la compañía está trabajando y, en general, GPT-4 es "menos creativo" con las respuestas y, por lo tanto, es menos probable que invente hechos.

La otra limitación principal es que el modelo GPT-4 se entrenó con datos de Internet hasta diciembre de 2023 (GPT-4o y 4o mini se cortaron en octubre de ese año). Sin embargo, dado que GPT-4 es capaz de realizar búsquedas en la web y no simplemente confiar en su conjunto de datos previamente entrenado, puede buscar y rastrear fácilmente datos más recientes en Internet.

GPT-4o es la última versión, por supuesto, y GPT-5 aún está disponible.