Microsoft explica cómo crearon ChatGPT miles de GPU Nvidia

ChatGPT saltó a la fama viral en los últimos seis meses, pero no surgió de la nada. Según una publicación de blog publicada por Microsoft el lunes, OpenAI, la compañía detrás de ChatGPT, se acercó a Microsoft para construir una infraestructura de IA en miles de GPU Nvidia hace más de cinco años.

La asociación de OpenAI y Microsoft ha llamado mucho la atención recientemente, especialmente después de que Microsoft invirtiera $10 mil millones en el grupo de investigación que está detrás de herramientas como ChatGPT y DALL-E 2 . Sin embargo, la asociación comenzó hace mucho tiempo, según Microsoft. Desde entonces, Bloomberg informa que Microsoft ha gastado "varios cientos de millones de dólares" en el desarrollo de la infraestructura para soportar ChatGPT y proyectos como Bing Chat .

Tarjeta gráfica Hopper H100.

Gran parte de ese dinero se destinó a Nvidia, que ahora está a la vanguardia del hardware informático necesario para entrenar modelos de IA. En lugar de GPU para juegos como las que encontraría en una lista de las mejores tarjetas gráficas , Microsoft optó por las GPU de nivel empresarial de Nvidia, como la A100 y la H100.

Sin embargo, no es tan simple como juntar tarjetas gráficas y entrenar un modelo de lenguaje. Como explica Nidhi Chappell, jefe de producto de Microsoft para Azure: “Esto no es algo en lo que simplemente compras un montón de GPU, las conectas y comenzarán a trabajar juntas. Hay mucha optimización a nivel de sistema para obtener el mejor rendimiento, y eso viene con mucha experiencia durante muchas generaciones”.

Con la infraestructura en su lugar, Microsoft ahora está abriendo su hardware a otros. La compañía anunció el lunes en una publicación de blog separada que ofrecería sistemas Nvidia H100 "bajo demanda en tamaños que van desde ocho hasta miles de GPU Nvidia H100", entregados a través de la red Azure de Microsoft.

La popularidad de ChatGPT ha disparado a Nvidia , que ha invertido en IA a través de hardware y software durante varios años. AMD, el principal competidor de Nvidia en tarjetas gráficas para juegos, ha estado intentando abrirse camino en el espacio con aceleradores como el Instinct MI300.

Según Greg Brockman, presidente y cofundador de OpenAI, la capacitación de ChatGPT no habría sido posible sin la potencia proporcionada por Microsoft: "El codiseño de supercomputadoras con Azure ha sido crucial para escalar nuestras exigentes necesidades de capacitación en IA, haciendo que nuestra investigación y el trabajo de alineación en sistemas como ChatGPT es posible”.

Se espera que Nvidia revele más sobre futuros productos de IA durante la GPU Technology Conference (GTC). con la presentación principal comienza el 21 de marzo. Microsoft está ampliando su hoja de ruta de IA a finales de esta semana, con una presentación centrada en el futuro de la IA en el lugar de trabajo programada para el 16 de marzo.