Así es como se comparan Claude 3.5 Sonnet y GPT-4o en una comparación directa

En el panorama cada vez mayor de los modelos de lenguaje grande (LLM), dos favoritos se destacan del resto de la carrera: Claude 3.5 Sonnet de Anthropic y GPT-4o de OpenAI (la “o” significa “Omni”). Ambas IA cuentan con capacidades impresionantes, pero ¿cuál reina suprema? Esta guía profundiza en Claude 3.5 Sonnet y GPT-4o, analizando sus fortalezas y debilidades en diversas tareas.

No solo exploraremos su precisión relativa y velocidades de respuesta, sino que también analizaremos sus estructuras de precios y niveles de servicio. Al final de este artículo, tendrá el conocimiento necesario para tomar una decisión informada sobre qué LLM se adapta mejor a sus necesidades y presupuesto específicos.

Precios y niveles

Los usuarios de ChatGPT pueden acceder al modelo GPT-4o de forma gratuita, pero la cantidad de consultas que pueden realizar en un lapso de tres horas es limitada. Superar ese límite lo llevará a usar GPT-3.5, el modelo más antiguo y menos capaz de OpenAI, hasta que el temporizador de enfriamiento se haya reiniciado.

Los usuarios deberán pagar la suscripción ChatGPT Plus de $ 20 por mes, una suscripción a Teams de $ 30 por mes o una suscripción Enterprise a precio de mercado si desean usar GPT-4o a su gusto. Pagar por el acceso no solo aumenta drásticamente el límite de tarifa por usar el modelo de IA, sino que también otorga acceso a funciones adicionales como la generación de imágenes Dall-E.

una captura de pantalla de los niveles de precios de Claude
antrópico

El acceso a Claude se establece de forma muy parecida. En el nivel gratuito, los usuarios pueden conversar con el chatbot en la web o mediante la aplicación de iOS. También pueden cargar imágenes y documentos al servidor Anthropic y consultar a la IA sobre sus contenidos, además de disfrutar de un uso limitado del nuevo modelo Claude 3.5 Sonnet.

Al pagar $20 al mes por una cuenta Pro, obtienes todo, desde el nivel gratuito, así como límites de uso más altos, acceso tanto a Claude 3 Opus como a Haiku, ancho de banda y disponibilidad prioritarios, y la capacidad de crear proyectos con la IA centrada en un conjunto. de documentos o expedientes. Pagar $30 al mes por persona (mínimo 5 personas) por una cuenta de Teams le otorga límites de uso aún más altos y la posibilidad de compartir chats entre compañeros de equipo.

Ventajas de utilizar Claude

Si bien es posible que Claude no disfrute del mismo grado de reconocimiento de nombre que GPT-4o, el último modelo de IA de Anthropic tiene una serie de ventajas sobre su rival, y no solo en los puntos de referencia de rendimiento . Por un lado, Claude cuenta con una ventana de contexto significativamente más grande que ChatGPT (200.000 caracteres frente a 128.000).

Esto significa que puede recordar y analizar una porción mucho mayor de conversaciones o textos anteriores, lo que genera respuestas más matizadas y relevantes, especialmente en interacciones más largas. Claude también está capacitado para priorizar la precisión sobre la creatividad en sus respuestas.

Puede que le cueste un poco generar haiku divertidos, pero Claude sobresale resumiendo trabajos de investigación y generando informes basados ​​en los datos cargados. Claude también tiene una fecha límite de conocimiento más reciente que GPT-4o: abril de 2024 frente a octubre de 2023.

una captura de pantalla del soneto de Claude 3.5 con la pantalla lateral de Artefactos
antrópico

Además, Anthropic entrenó sus modelos Claude como IA constitucionales. Esto significa que el sistema implementa un conjunto de principios para emitir juicios sobre los resultados generados, guiando efectivamente el modelo hacia el tipo de comportamiento ético dictado por la constitución. Eso incluye evitar resultados tóxicos o discriminatorios, así como evitar describir o defender actividades ilegales o poco éticas.

Ventajas de utilizar GPT-4o

GPT-4o, por otro lado, ofrece a los usuarios una variedad más amplia de funciones, una base de conocimientos más amplia y opciones de inicio de sesión más flexibles que Claude.

A diferencia de la oferta de Anthropic, ChatGPT puede generar imágenes (aunque esa característica requiere una suscripción) y acceder a la web para encontrar la información más actualizada disponible, no solo los datos con los que fue entrenado. Y a diferencia del proceso de registro con Claude, los usuarios de GPT-4o no tendrán que proporcionar su número de teléfono para verificación, ni ninguna credencial, para comenzar a usar el modelo. Y, gracias a su base de conocimientos más amplia, GPT-4o es más experto en generar contenido creativo a través de imágenes, texto y audio que Claude.

El sitio web ChatGPT también tiende a sobrecargarse con solicitudes de usuarios a un ritmo mucho menor que el de Claude.

Comparación de velocidad y precisión

Ambos modelos son capaces de generar una amplia variedad de resultados de texto, desde refinar la prosa escrita por el usuario hasta crear código de computadora y algoritmos de hojas de cálculo. Cuando se les pidió que generaran un “fragmento de código Python que medirá el área de un círculo y generará una gráfica de la función”, ambos devolvieron fragmentos estructurados de manera similar. GPT-4o produjo lo siguiente:

importar numpy como np
importar matplotlib.pyplot como plt

# Función para calcular el área de un círculo.
def calcular_area(radio):
devolver np.pi * radio ** 2

# Generar un rango de valores de radio
radios = np.linspace(0, 10, 100) # radios de 0 a 10 con 100 puntos

# Calcular los valores de área correspondientes.
áreas = calcular_área(radios)

# Trazando la función
plt.figura(tamaño de figura=(10, 6))
plt.plot(radios, áreas, etiqueta='Área = πr²')
plt.title('Área de un círculo como función del radio')
plt.xlabel('Radio')
plt.ylabel('Área')
plt.leyenda()
plt.grid(Verdadero)
plt.mostrar()

Mientras tanto, la respuesta de Claude fue un poco más concreta:

importar matematicas
importar numpy como np
importar matplotlib.pyplot como plt

def área_círculo(radio):
devolver math.pi * radio**2

# Generar radios de 0 a 10 con 100 puntos
radios = np.linspace(0, 10, 100)

# Calcular áreas para cada radio
áreas = [circle_area(r) para r en radios]

# Crea la trama
plt.figura(tamaño de figura=(10, 6))
plt.plot(radios, áreas, 'b-', ancho de línea=2)
plt.title('Área de un círculo como función del radio')
plt.xlabel('Radio')
plt.ylabel('Área')
plt.grid(Verdadero)

# Agrega algunos puntos interesantes
plt.plot(0, área_circulo(0), 'ro', etiqueta='r = 0′)
plt.plot(1, área_circular(1), 'ro', etiqueta='r = 1′)
plt.plot(5, área_circular(5), 'ro', etiqueta='r = 5′)
plt.plot(10, círculo_area(10), 'ro', etiqueta='r = 10′)

plt.leyenda()
plt.mostrar()

En términos de identificación de imágenes, los dos modelos son muy similares. Cuando se les pidió que identificaran los diversos aspectos de la siguiente imagen, tanto GPT-4o como Claude 3.5 pudieron encontrar y describir fácilmente cada uno de los 21 elementos presentes.

una serie de imágenes generadas en 3D hechas por Meta 3D Gen
Meta

GPT-4o tiene la ventaja de brindar información sobre eventos recientes, dada su capacidad de buscar en la web noticias más recientes que sus datos de entrenamiento. Al preguntarle a Claude “qué pasó ayer en Luxemburgo” solo obtendrá una nota que dice: “Pido disculpas, pero no tengo acceso a noticias o información en tiempo real sobre eventos específicos que ocurrieron ayer en Luxemburgo. Mi límite de conocimiento es en abril de 2024 y no tengo información sobre los eventos posteriores a esa fecha”. La IA ofrece una serie de recomendaciones útiles sobre dónde podría encontrar la información que solicitó.

Encontré que comparar los dos sistemas fue un desafío, principalmente porque solo pude hacer media docena de solicitudes a Claude antes de que el sistema me bloqueara durante tres horas. Incluso en el nivel gratuito de ChatGPT, no quedaré excluido del sistema por completo; simplemente tendré que conversar con un modelo ligeramente inferior por un tiempo.

¿Cual es mejor?

En última instancia, la mejor opción depende de sus necesidades específicas. Si prioriza la precisión fáctica, el procesamiento de documentos prolongados y tiene un presupuesto ajustado, Claude podría ser una mejor opción.

Sin embargo, si necesita una gama más amplia de funcionalidades creativas y está dispuesto a pagar por funciones adicionales, ChatGPT sigue siendo la mejor opción.