Explicación de los modelos ChatGPT: cómo utilizar cada uno, según OpenAI

Aunque todo el auge de la IA fue desencadenado por un solo modelo ChatGPT , muchas cosas han cambiado desde 2022. Se lanzaron nuevos modelos, se reemplazaron modelos antiguos, las actualizaciones se implementan y retroceden cuando salen mal: el mundo de los LLM está bastante ocupado. Por el momento, tenemos seis LLM de OpenAI para elegir y, como saben tanto los usuarios como Sam Altman, sus nombres son completamente inútiles.

La mayoría de las personas probablemente hayan estado usando el modelo más nuevo que han podido conseguir, pero resulta que cada uno de los seis modelos actuales es bueno en diferentes cosas, y OpenAI finalmente ha decidido decirnos qué modelo usar para qué tareas.

¿Por qué hay seis modelos en primer lugar?

Los LLM son impredecibles: los usuarios nunca saben qué tipo de respuestas obtendrán y los desarrolladores tampoco lo saben realmente. Claro, podría ser más conveniente si tuviéramos todas las capacidades disponibles reunidas en un solo modelo, pero eso no es tan fácil como parece.

A medida que OpenAI modifica sus modelos, algunas cosas mejoran y otras empeoran y, a veces, se producen efectos secundarios inesperados. No se sabe cuánto tiempo tomaría equilibrar las cosas a la perfección, por lo que tiene más sentido lanzar nuevas versiones incluso cuando las mejoras se centran sólo en unas pocas áreas.

Los resultados de este enfoque son los seis modelos principales que tenemos ahora: GPT-4o , GPT-4.5, OpenAI o4-mini, OpenAI o4-mini-high, OpenAI o3 y OpenAI o1 pro mode. Y lo voy a decir de nuevo: estos nombres realmente son inútiles. Es posible que OpenAI nos haya proporcionado un documento que explica lo que hace cada uno ahora, pero eso no significa que podrá recordar qué nombre coincide con qué capacidades, así que considere guardar esta pequeña hoja de referencia del documento si necesita recordarlo.

GPT-4o

Como parte de la última familia de modelos 4o, el GPT-4o “sobresale en las tareas cotidianas”. Esto incluye:

  • Reunión creativa
  • resumiendo
  • Escritura/comprobación de correo electrónico
  • Contenido creativo

Puede buscar en la web con él, generar imágenes , utilizar funciones de voz avanzadas, analizar datos y crear GPT personalizados. También puede cargar varios tipos de archivos para facilitar sus indicaciones.

Sin embargo, según la propia investigación de OpenAI, 4o tiene un pequeño problema de alucinaciones. No es el peor del grupo, pero alucinó aproximadamente el doble que o1 durante las pruebas.

Esto puede ser problemático si lo usas para buscar en la web o aprender cosas nuevas; el aspecto más complicado de las alucinaciones es que a menudo suenan completamente plausibles, lo que hace que sea más difícil simplemente "comprobar cuando algo suena mal". En cambio, la única forma de estar seguro es comprobar casi todo lo que aún no sabes que es cierto.

GPT-4.5

Según OpenAI, el punto fuerte de GPT-4.5 es la inteligencia emocional. Esto significa que debería ser bueno para ayudarte a comunicarte con otras personas, con recomendaciones oficiales que incluyen:

  • Publicaciones en redes sociales
  • Descripciones de productos
  • Carta de disculpa al cliente

Con otras fortalezas, como una comunicación clara y creatividad, GPT-4.5 está mejor equipado para ayudarlo a encontrar el tono o fraseo perfecto para situaciones específicas y asegurarse de que todo suene humano.

OpenAI o4-mini

Uno de los modelos con nombres más terribles, o4-mini, elimina el elemento "GPT" del esquema de nombres y cambia torpemente el 4o por o4. Es un modelo más pequeño, lo que significa que no está repleto de tanta información aleatoria de Internet como un modelo de tamaño completo.

La ventaja de esto es que es rápido y menos costoso de ejecutar, y la desventaja es que el modelo tiene menos “conocimiento del mundo” y es propenso a tener alucinaciones para compensar eso.

En lugar de hacerle preguntas sobre el mundo, OpenAI recomienda usar o4-mini para tareas técnicas rápidas. Los ejemplos incluyen:

  • Extracción de datos clave de un archivo CSV
  • Generar resúmenes rápidos de artículos.
  • Verificar o corregir errores en pequeños bloques de código

OpenAI o4-mini-alto

Aquí hay otro nombre terrible cuando se ve de forma aislada, pero bastante fácil de entender si ya sabes qué es OpenAI o4-mini. Sigue siendo un modelo pequeño, pero es un paso adelante respecto al o4-mini normal porque "piensa por más tiempo para lograr una mayor precisión".

Esto lo hace mejor en tareas de codificación, matemáticas y explicaciones científicas más detalladas. Aquí están los ejemplos de OpenAI:

  • Resolver ecuaciones matemáticas complejas con explicaciones.
  • Redacción de consultas SQL para extracción de datos.
  • Explicar conceptos científicos en términos simples.

OpenAI o3

Este es técnicamente un modelo más antiguo (porque no tiene un “4”), pero debido a que la familia o4/4o no realizó mejoras en todas las áreas, sigue siendo muy relevante. o3 es particularmente bueno en tareas complejas de varios pasos: el tipo de proyectos que deben realizarse en múltiples etapas con múltiples indicaciones.

Esto incluye planificación estratégica, análisis detallados, codificación extensa, matemáticas avanzadas, ciencias y razonamiento visual. Si desea iniciar una tarea que sabe que requerirá una sesión de varias indicaciones para finalizar, usar o3 ayudará a minimizar las posibilidades de que el modelo pierda la noción del contexto o tenga alucinaciones a mitad de camino.

OpenAI sugiere casos de uso como:

  • Desarrollar un análisis de riesgos
  • Elaborar una estrategia de negocio basada en datos.
  • Ejecutar tareas de análisis de datos de varios pasos

Modo OpenAI o1 pro

OpenAI o1 ahora se considera un "modelo heredado", aunque aún no tiene ni un año . La versión "modo profesional" está adaptada al razonamiento complejo, lo que significa que lleva más tiempo pensar, pero a cambio ofrece respuestas mejor pensadas.

o1 también obtiene las mejores puntuaciones en la evaluación PersonQA de OpenAI, que mide la tasa de alucinaciones. Durante las pruebas, o1 alucina aproximadamente la mitad que o3 y tres veces menos que los modelos más pequeños como el 04-mini. Si eres un gran usuario de ChatGPT y tus sesiones tienden a ser largas, minimizar la tasa de alucinaciones podría ahorrarte una buena cantidad de tiempo a largo plazo.

Aquí están los ejemplos de OpenAI:

  • Redacción de análisis de riesgos detallados.
  • Generar un resumen de investigación de varias páginas
  • Creando un algoritmo para la previsión financiera.

Cómo utilizar diferentes modelos de ChatGPT

Desafortunadamente, solo puedes acceder a GPT-4o y GPT-4o mini en el nivel gratuito de OpenAI. Si es usuario Plus, Pro, Team o Enterprise, puede usar el selector de modelo para elegir qué modelo desea usar.

ChatGPT también está integrado en otros productos de terceros, tanto gratuitos como de pago, por lo que vale la pena comprobar qué modelos utilizan los diferentes productos. Por ejemplo, mi motor de búsqueda pago, Kagi , me da acceso a múltiples modelos OpenAI. También existen muchos otros servicios agregados de IA que le brindan acceso a múltiples modelos de OpenAI y otras compañías por un precio más asequible que suscribirse a cada compañía por separado.

Si bien es útil tener esta información sobre los diferentes modelos, no afecta a todos. Si utiliza principalmente ChatGPT para generar imágenes, buscar en la web y enviar consultas generales, entonces el GPT-4o predeterminado está totalmente bien. Sólo si te gusta la programación, las matemáticas, las ciencias o proyectos particularmente grandes es posible que quieras pensar qué modelo es mejor para el trabajo.