Esta nueva tecnología soluciona el mayor problema de las GPU modernas

Ampliación de almacenamiento de GPU
pannesia

En un desarrollo interesante para la industria de las GPU, la memoria conectada a PCIe cambiará nuestra forma de pensar sobre la capacidad y el rendimiento de la memoria de la GPU. Panmnesia, una empresa respaldada por el instituto de investigación KAIST de Corea del Sur, está trabajando en una tecnología llamada Compute Express Link, o CXL, que permite a las GPU utilizar recursos de memoria externa a través de la interfaz PCIe.

Tradicionalmente, las GPU como la RTX 4060 están limitadas por su VRAM integrada, que puede obstaculizar el rendimiento en tareas que requieren mucha memoria, como el entrenamiento de IA, el análisis de datos y los juegos de alta resolución. CXL aprovecha la conexión PCIe de alta velocidad para conectar módulos de memoria externos directamente a la GPU.

Este método proporciona una opción de expansión de memoria de baja latencia, con métricas de rendimiento que muestran mejoras significativas con respecto a los métodos tradicionales. Según los informes, la nueva tecnología logra alcanzar una latencia de nanosegundos de dos dígitos, lo que supone una reducción sustancial en comparación con las soluciones estándar basadas en SSD.

Ampliación de almacenamiento de GPU mediante CXL.
pamnesia

Además, esta tecnología no se limita sólo a la RAM tradicional. Los SSD también se pueden utilizar para ampliar la memoria de la GPU, ofreciendo una solución versátil y escalable. Esta capacidad permite la creación de sistemas de memoria híbridos que combinan la velocidad de la RAM con la capacidad de los SSD, mejorando aún más el rendimiento y la eficiencia.

Si bien CXL opera en un enlace PCIe, integrar esta tecnología con las GPU no es sencillo. Las GPU carecen de la estructura lógica CXL y los subsistemas necesarios para admitir puntos finales DRAM o SSD. Por lo tanto, simplemente agregar un controlador CXL no es factible.

Los sistemas de memoria y caché de GPU solo reconocen expansiones a través de la Memoria Virtual Unificada (UVM). Sin embargo, las pruebas realizadas por Panmnesia revelaron que UVM tuvo el rendimiento más pobre entre los núcleos de GPU probados debido a la sobrecarga de la intervención del tiempo de ejecución del host durante fallas de página y transferencias de datos ineficientes a nivel de página.

Para abordar el problema, Panmnesia desarrolló una serie de capas de hardware que admiten todos los protocolos CXL clave, consolidados en un controlador unificado. Este complejo raíz compatible con CXL 3.1 incluye múltiples puertos raíz para memoria externa a través de PCIe y un puente de host con un decodificador de memoria de dispositivo administrado por host. Este decodificador se conecta al bus del sistema de la GPU y administra la memoria del sistema, brindando acceso directo al almacenamiento ampliado a través de instrucciones de carga/almacenamiento, eliminando efectivamente los problemas de UVM.

Las implicaciones de esta tecnología son de gran alcance. Para la IA y el aprendizaje automático, la capacidad de agregar más memoria significa manejar conjuntos de datos más grandes de manera más eficiente, acelerar los tiempos de entrenamiento y mejorar la precisión del modelo. En los juegos, los desarrolladores pueden superar los límites de la fidelidad y complejidad gráfica sin verse limitados por las limitaciones de VRAM.

Para centros de datos y entornos de computación en la nube, la tecnología CXL de Panmnesia proporciona una forma rentable de actualizar la infraestructura existente. Al conectar memoria adicional a través de PCIe, los centros de datos pueden mejorar su potencia computacional sin requerir revisiones extensas de hardware.

A pesar de su potencial, Panmnesia enfrenta un gran desafío para lograr su adopción en toda la industria. Las mejores tarjetas gráficas de AMD y Nvidia no son compatibles con CLX y es posible que nunca lo sean. También existe una alta posibilidad de que los actores de la industria desarrollen sus propias tecnologías de memoria conectada a PCIe para GPU. No obstante, la innovación de Panmnesia representa un paso adelante para abordar los cuellos de botella de la memoria de la GPU, con el potencial de afectar significativamente la informática y los juegos de alto rendimiento.