La supercomputadora de Nvidia puede traer una nueva era de ChatGPT

El CEO de Nvidia mostrando la computadora Grace Hopper de la compañía.
nvidia

Nvidia acaba de anunciar una nueva supercomputadora que puede cambiar el futuro de la IA. El DGX GH200, equipado con casi 500 veces más memoria que los sistemas con los que estamos familiarizados ahora, pronto caerá en manos de Google, Meta y Microsoft.

¿La meta? Revolucionando la IA generativa , los sistemas de recomendación y el procesamiento de datos a una escala que nunca antes habíamos visto. ¿Se beneficiarán los modelos de lenguaje como GPT y qué significará eso para los usuarios habituales?

Describir la DGX GH200 de Nvidia requiere el uso de términos con los que la mayoría de los usuarios nunca tienen que lidiar. “Exaflop”, por ejemplo, porque la supercomputadora proporciona 1 exaflop de rendimiento y 144 terabytes de memoria compartida. Nvidia señala que esto significa casi 500 veces más memoria que en un solo sistema Nvidia DGX A100.

Volvamos a la cifra de 1 exaflop y dividámosla un poco. Un exaflop equivale a un quintillón de operaciones de coma flotante por segundo (FLOP). A modo de comparación, el RTX 4090 de Nvidia puede alcanzar alrededor de 100 teraflops (TFLOP) cuando se realiza overclocking. Un TFLOP equivale a un billón de operaciones de punto flotante por segundo. La diferencia es asombrosa, pero, por supuesto, la RTX 4090 no es una GPU de centro de datos. El DGX GH200, por otro lado, integra una cantidad sustancial de estas GPU de alto rendimiento que no pertenecen ni cerca de una PC de consumo.

Superchip Grace Hopper de Nvidia.
nvidia

La computadora funciona con los superchips GH200 Grace Hopper de Nvidia. Hay 256 de ellos en total, que, gracias a la tecnología de interconexión NVLink de Nvidia, pueden trabajar juntos como un sistema unificado, creando esencialmente una GPU masiva.

Los superchips GH200 utilizados aquí tampoco necesitan una conexión PCIe tradicional entre la CPU y la GPU. Nvidia dice que ya están equipados con un Nvidia Grace CP, U basado en ARM, así como con una GPU H100 Tensor Core. Nvidia también tiene algunas interconexiones de chips elegantes, esta vez usando el NVLink-C2C. Como resultado, se dice que el ancho de banda entre el procesador y la tarjeta gráfica mejora significativamente (hasta 7 veces) y es más eficiente energéticamente (hasta 5 veces).

Empaquetar más de 200 de estos chips en una sola potencia de una supercomputadora es lo suficientemente impresionante, pero se vuelve aún mejor cuando se considera que, anteriormente, solo se podían unir ocho GPU a la vez con NVLink. Un salto de ocho a 256 chips ciertamente le da a Nvidia algunos derechos de fanfarronear.

Ahora bien, ¿dónde terminará la DGX GH200 y qué puede ofrecer al mundo? Nvidia está construyendo su propia Supercomputadora Helios como un medio para avanzar en su investigación y desarrollo de IA. Abarcará cuatro sistemas DGX GH200, todos interconectados con Quantum-2 InfiniBand de Nvidia. Se espera que entre en línea a finales de año.

Nvidia también está compartiendo su nuevo desarrollo con el mundo, comenzando con Google Cloud, Meta y Microsoft. El propósito es muy similar: explorar cargas de trabajo generativas de IA.

Cuando se trata de Google y Microsoft, es difícil no imaginar que el DGX GH200 podría impulsar mejoras en Bard , ChatGPT y Bing Chat .

El director ejecutivo de Nvidia muestra la computadora Hopper de la empresa.
nvidia

La importante potencia computacional proporcionada por un solo sistema DGX GH200 lo hace ideal para avanzar en el entrenamiento de modelos de lenguaje sofisticados. Es difícil decir qué podría significar eso exactamente sin el comentario de una de las partes interesadas, pero podemos especular un poco.

Más poder significa modelos más grandes, lo que significa texto más matizado y preciso y una gama más amplia de datos para entrenarlos. Podríamos ver una mejor comprensión cultural, más conocimiento del contexto y una mayor coherencia. Los chatbots de IA especializados también podrían comenzar a aparecer, reemplazando aún más a los humanos en campos como la tecnología.

¿Deberíamos preocuparnos por el posible desplazamiento laboral o deberíamos estar entusiasmados con los avances que podrían traer estas supercomputadoras? La respuesta no es sencilla. Una cosa es segura: la DGX GH200 de Nvidia podría cambiar las cosas en el mundo de la IA, y Nvidia acaba de aumentar su liderazgo en IA sobre AMD una vez más .