DeepSeek: todo lo que necesitas saber sobre la IA que destronó a ChatGPT

enero 28, 2025 Aranzulla de Los Pobres

Una startup china de un año de antigüedad está arrasando en la industria de la IA después de lanzar un chatbot que rivaliza con el rendimiento de ChatGPT y utiliza una fracción del gasto en energía, refrigeración y capacitación de lo que exigen los sistemas OpenAI, Google y Anthropic. Aquí encontrará todo lo que necesita saber sobre los modelos V3 y R1 de Deepseek y por qué la compañía podría alterar fundamentalmente las ambiciones de inteligencia artificial de Estados Unidos.

¿Qué es DeepSeek?

DeepSeek (técnicamente, “Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.”) es una startup china de IA que se fundó originalmente como un laboratorio de IA para su empresa matriz, High-Flyer, en abril de 2023. Ese mayo, DeepSeek se escindió en su propia empresa (con High-Flyer permaneciendo como inversor) y también lanzó su modelo DeepSeek-V2. V2 ofreció un rendimiento a la par de otras empresas chinas líderes en inteligencia artificial, como ByteDance, Tencent y Baidu, pero a un costo operativo mucho menor.

La compañía siguió con el lanzamiento de V3 en diciembre de 2024. V3 es un modelo de 671 mil millones de parámetros que, según se informa, tardó menos de 2 meses en entrenarse . Es más, según un análisis reciente de Jeffries, el “costo de formación de DeepSeek es de sólo 5,6 millones de dólares (suponiendo un coste de alquiler de 2 dólares por hora y 800 horas). Eso es menos del 10% del costo de la Llama de Meta”. Esa es una pequeña fracción de los cientos de millones a miles de millones de dólares que empresas estadounidenses como Google, Microsoft, xAI y OpenAI han gastado en entrenar sus modelos.

¡Presentamos DeepSeek-V3!
El mayor avance hasta ahora:
⚡ 60 tokens/segundo (¡3 veces más rápido que V2!)
Capacidades mejoradas
Compatibilidad API intacta
Modelos y aplicaciones totalmente de código abierto. papeles
1/n pic.twitter.com/p1dV9gJ2Sd
– DeepSeek (@deepseek_ai) 26 de diciembre de 2024

Las pruebas comparativas pusieron el rendimiento del V3 a la par del GPT-4o y Claude 3.5 Sonnet. Un artículo de opinión de diciembre de 2024 en The Hill categorizó el éxito de DeepSeek como el “momento Sputnik” de Estados Unidos.

DeepSeek lanzó su modelo R1-Lite-Preview en noviembre de 2024, afirmando que el nuevo modelo podría superar a la familia de modelos de razonamiento o1 de OpenAI (y hacerlo a una fracción del precio). La compañía estima que el modelo R1 es entre 20 y 50 veces menos costoso de ejecutar, dependiendo de la tarea, que el o1 de OpenAI. Posteriormente, DeepSeek lanzó DeepSeek-R1 y DeepSeek-R1-Zero en enero de 2025. El modelo R1, a diferencia de su rival o1, es de código abierto, lo que significa que cualquier desarrollador puede usarlo.

Como tal, V3 y R1 han ganado popularidad desde su lanzamiento, con el Asistente de IA impulsado por DeepSeek V3 desplazando a ChatGPT en la parte superior de las tiendas de aplicaciones . El capitalista de riesgo Marc Andreesen, en una publicación reciente en las redes sociales, calificó el chatbot de DeepSeek como "uno de los avances más sorprendentes e impresionantes que he visto en mi vida" y un "profundo regalo para el mundo".

¿Qué puede hacer DeepSeek?

Como modelo de lenguaje grande de código abierto, los chatbots de DeepSeek pueden hacer esencialmente todo lo que ChatGPT, Gemini y Claude pueden hacer. Eso incluye generación de texto, audio, imágenes y videos. Es más, la recién lanzada familia de modelos multimodales de DeepSeek, denominada Janus Pro , supuestamente supera a DALL-E 3, así como a PixArt-alpha, Emu3-Gen y Stable Diffusion XL, en un par de puntos de referencia de la industria. DeepSeek-R1, que rivaliza con o1, está diseñado específicamente para realizar tareas complejas de razonamiento, mientras genera soluciones paso a paso a problemas y establece “cadenas lógicas de pensamiento”, donde explica su proceso de razonamiento paso a paso al resolver un problema. .

oh chico #búsqueda profunda
– Alexios Mantzarlis (@mantzarlis.com) 2025-01-27T16:50:40.640Z

Lo que los productos de DeepSeek no pueden hacer es hablar de la Plaza Tienanmen. O las protestas de los Paraguas Amarillos. O el parecido del presidente Xi Jinping con Winnie the Pooh. Básicamente, si se trata de un tema considerado prohibido por el Partido Comunista Chino, los chatbots de DeepSeek no lo abordarán ni participarán de ninguna manera significativa.

¿Quién puede utilizar DeepSeek?

Prohibición temporal de registro en DeepSeek — Andrew Tarantola / DeepSeek / Tendencias digitales

Como LLM de código abierto, cualquier desarrollador puede utilizar el modelo de DeepSeek de forma gratuita. OpenAI cobra $200 por mes por la suscripción Pro necesaria para acceder a o1. Los modelos de DeepSeek están disponibles en la web, a través de la API de la empresa y mediante aplicaciones móviles. Deberá registrarse para obtener una cuenta gratuita en el sitio web de DeepSeek para poder utilizarla; sin embargo, la compañía ha suspendido temporalmente los nuevos registros en respuesta a "ataques maliciosos a gran escala a los servicios de DeepSeek". Los usuarios existentes pueden iniciar sesión y utilizar la plataforma normalmente, pero aún no se sabe cuándo los nuevos usuarios podrán probar DeepSeek por sí mismos.

¿Por qué DeepSeek de repente se vuelve tan importante?

Desde el lanzamiento de ChatGPT en noviembre de 2023, las empresas estadounidenses de inteligencia artificial se han centrado en crear modelos de lenguajes más grandes, más potentes, más expansivos, más potentes y que requieren más recursos. En lugar de buscar crear LLM más rentables y energéticamente eficientes, empresas como OpenAI, Microsoft, Anthropic y Google consideraron adecuado simplemente forzar el avance de la tecnología por fuerza bruta, siguiendo la tradición estadounidense, simplemente desperdiciando cantidades absurdas de dinero y recursos. al problema. Solo en 2024, se esperaba que el director ejecutivo de xAI, Elon Musk, gastara personalmente más de 10 mil millones de dólares en iniciativas de IA. OpenAI y sus socios acaban de anunciar una iniciativa del Proyecto Stargate de 500 mil millones de dólares que aceleraría drásticamente la construcción de servicios públicos de energía verde y centros de datos de inteligencia artificial en todo Estados Unidos. Google planea priorizar la ampliación de la plataforma Gemini a lo largo de 2025 , según el director ejecutivo Sundar Pichai, y se espera que gaste miles de millones este año para lograr ese objetivo. Meta anunció a mediados de enero que gastaría hasta 65 mil millones de dólares este año en el desarrollo de la IA.

DeepSeek acaba de mostrarle al mundo que nada de eso es realmente necesario: que el “boom de la IA” que ha ayudado a impulsar la economía estadounidense en los últimos meses y que ha hecho que las empresas de GPU como Nvidia sean exponencialmente más ricas de lo que eran en octubre de 2023, puede ser nada más que una farsa. También pone en duda qué liderazgo tiene realmente Estados Unidos en IA, a pesar de prohibir repetidamente los envíos de GPU de última generación a China durante el año pasado.

"La conclusión es que el desempeño superior de Estados Unidos ha sido impulsado por la tecnología y el liderazgo que tienen las empresas estadounidenses en inteligencia artificial", dijo a CNN Keith Lerner, analista de Truist. "El lanzamiento del modelo DeepSeek está llevando a los inversores a cuestionar el liderazgo que tienen las empresas estadounidenses y cuánto se está gastando y si ese gasto generará ganancias (o un gasto excesivo)".

En resumen, DeepSeek acaba de vencer a la industria estadounidense de la IA en su propio juego, lo que demuestra que el mantra actual de “crecimiento a toda costa” ya no es válido. "DeepSeek claramente no tiene acceso a tanta computación como los hiperescaladores estadounidenses y de alguna manera logró desarrollar un modelo que parece altamente competitivo", dijo a CNBC Srini Pajjuri, analista de semiconductores de Raymond James. Si una startup china puede construir un modelo de IA que funcione tan bien como el último y mejor de OpenAI, y hacerlo en menos de dos meses y por menos de 6 millones de dólares, entonces, ¿de qué sirve Sam Altman?

"El tiempo dirá si la amenaza de DeepSeek es real: la carrera por determinar qué tecnología funciona y cómo responderán y evolucionarán los grandes actores occidentales", dijo a CNN Michael Block, estratega de mercado de Third Seven Capital. "Los mercados se habían vuelto demasiado complacientes con el comienzo de la era Trump 2.0 y es posible que hayan estado buscando una excusa para retroceder, y aquí encontraron una excelente".