El DLSS 4 de Nvidia no es lo que crees que es. Desmentimos los mitos

enero 13, 2025 Aranzulla de Los Pobres

Nvidia se robó el show en CES 2025 con el anuncio de la RTX 5090 y, a pesar de mucho discurso sobre el precio de la tarjeta de $ 2000, marca el comienzo de una gran cantidad de tecnología nueva. El principal de ellos es DLSS 4, que aporta generación de fotogramas múltiples a las GPU de Nvidia, ofreciendo un aumento de rendimiento 4 veces mayor en más de 75 juegos inmediatamente cuando las nuevas GPU de la serie RTX 50 de Nvidia salen a la calle.

Sin embargo, he visto demasiados malentendidos sobre cómo funciona realmente DLSS 4 . Entre los comentarios engañosos del CEO de Nvidia y un rediseño radical de cómo funciona DLSS, no es de extrañar que haya información errónea sobre la nueva tecnología, de qué es capaz y, fundamentalmente, qué limitaciones tiene.

Entonces, dejemos las cosas claras, al menos tanto como pueda antes de que lleguen las nuevas tarjetas gráficas de Nvidia y todos experimentemos lo que DLSS 4 tiene para ofrecer de primera mano.

No, no 'predice el futuro'

Jensen, director ejecutivo de Nvidia, frente a un fondo. — NVIDIA

Uno de los principales problemas a la hora de comprender correctamente cómo funciona DLSS 4 proviene de un comentario que hizo el director ejecutivo de Nvidia, Jensen Huang, durante una sesión de preguntas y respuestas. Jarred Walton de Tom's Hardware le preguntó a Huang cómo funciona DLSS 4 a nivel técnico, y Huang negó categóricamente que DLSS 4 utilice interpolación de fotogramas. Dijo que DLSS 4 "predice el futuro" en lugar de "interpolar el pasado". Esa es una cita de moda, sin duda. Lástima que sea incorrecto.

Huang se ha mostrado poético sobre DLSS Frame Generation en el pasado, y aunque este tipo de encuadre funciona para explicar una tecnología como DLSS 4 a una audiencia general, también genera algunos malentendidos sobre cómo funciona realmente. Después de esta cita, varios lectores se acercaron y me dijeron que no entendía cómo funciona DLSS 4 . Resulta que no entiendo mal cómo funciona, pero entiendo por qué hay tanta confusión.

La generación de cuadros múltiples de DLSS 4 utiliza una técnica llamada interpolación de cuadros. Esta es la misma técnica que vimos en DLSS 3, y es la misma técnica que encontrará en otras herramientas de generación de fotogramas como Lossless Scaling y FSR 3 de AMD . La interpolación de fotogramas funciona así: su tarjeta gráfica genera dos fotogramas y luego interviene un algoritmo para calcular la diferencia entre esos fotogramas. Luego, "genera" un fotograma intermedio, adivinando cómo se vería el fotograma intersticial en función de la diferencia entre los dos fotogramas que se renderizaron.

Un movimiento de cambio de gráficos a través del DLSS 3 de Nvidia. — NVIDIA

Y DLSS 4 utiliza interpolación de cuadros. Ha habido algunas investigaciones preliminares sobre nuevas técnicas para generar fotogramas (en particular, investigaciones de Intel sobre la extrapolación de fotogramas ), pero aún es temprano para esa tecnología. Hay algunos detalles que no puedo compartir todavía, pero he confirmado con múltiples fuentes que DLSS 4, de hecho, utiliza interpolación de fotogramas. También tiene sentido. Este tipo de herramientas de renderizado no surgen de la nada, y casi siempre hay una larga serie de trabajos de investigación antes de que cualquier nueva técnica de renderizado se convierta en un producto comercializable como DLSS 4.

Eso no quita lo que DLSS 4 es capaz de hacer. Puede que esté utilizando la misma técnica que DLSS 3 para crear nuevos fotogramas, pero eso no debería distraerte de lo que realmente puede hacer DLSS 4.

La latencia no es el problema que crees que es

El widget de latencia en Special K. — Jacob Roach / Tendencias digitales

Entiendo por qué Nvidia no quiere comentar mucho sobre el uso de la interpolación de cuadros por parte de DLSS 4. Esto se debe a que la interpolación de cuadros introduce latencia. Debes renderizar dos fotogramas y luego realizar la interpolación antes de que se muestre el primer fotograma de la secuencia, por lo que cuando utilizas cualquier herramienta de interpolación de fotogramas, básicamente estás jugando con un ligero retraso. La suposición que he visto es que estos fotogramas adicionales aumentan linealmente la latencia, lo cual no es el caso.

The Verge mostró preocupación diciendo que quería "ver cómo la tecnología de nueva generación de fotogramas afecta la latencia", mientras que TechSpot declaró que "a los usuarios les preocupa que la renderización de múltiples fotogramas pueda agravar el problema [de latencia]". Es un contraataque natural a los fotogramas "falsos" multiplicados que DLSS 4 puede escupir. Si generar un fotograma causa un problema de latencia, seguramente generar tres de ellos causaría un problema de latencia mayor. Pero no es así como funciona.

Por eso es tan importante comprender que DLSS 4 utiliza interpolación de cuadros. La idea de jugar con un retraso no es diferente entre DLSS 3 que genera un cuadro adicional y DLSS 4 que genera tres cuadros adicionales; el proceso aún implica renderizar dos cuadros y comparar la diferencia entre ellos. Su latencia no aumenta significativamente entre la inserción de uno, dos o tres fotogramas adicionales entre los dos que se renderizaron. Independientemente del número de fotogramas que se interpongan entre ellos, la latencia añadida por el proceso de interpolación de fotogramas es prácticamente la misma.

Permítanme ilustrar esto. Digamos que estás jugando a 60 fotogramas por segundo (fps). Eso significa que hay 16,6 milisegundos entre cada fotograma que ves. Con DLSS 3, su velocidad de fotogramas se duplicaría a 120 fps, pero su latencia no se reduciría a la mitad a 8,3 ms. El juego parece más fluido, pero todavía hay 16,6 ms entre cada fotograma renderizado. Con DLSS 4, podrás subir hasta 240 fps, cuadruplicando tu velocidad de fotogramas, pero una vez más, la latencia no baja a 4,2 ms. Siguen siendo los mismos 16,6 ms.

Esta es una mirada muy reductiva a la latencia de la PC: hay una sobrecarga para que se ejecute DLSS Frame Generation, además de la latencia agregada por el monitor y el mouse, pero es útil para comprender que la latencia central no aumenta linealmente cuando se agregan más cuadros al marco. proceso de interpolación. El tiempo entre cada fotograma renderizado no cambia. La latencia que experimenta sigue siendo en gran medida el resultado de su velocidad de fotogramas base antes de la generación de fotogramas DLSS y la sobrecarga que tiene la herramienta.

No tienes que confiar simplemente en mi palabra. Digital Foundry probó DLSS 4, incluida la latencia, y encontró exactamente lo que acabo de describir. "Me parece que la mayor parte de la latencia adicional todavía proviene del almacenamiento en búfer de ese cuadro adicional, pero agregar más cuadros intermedios conlleva un aumento relativamente mínimo en la latencia", escribió Richard Leadbetter de Digital Foundry . La pequeña cantidad de latencia adicional simplemente proviene de que DLSS calcula más fotogramas entre los dos que se han renderizado, por lo que la mayor parte del aumento de latencia con DLSS 4 no es muy diferente de DLSS 3.

El problema de latencia con DLSS 4 es en gran medida el mismo que con DLSS 3. Si juegas a una velocidad de fotogramas base baja, hay una desconexión entre la capacidad de respuesta que estás experimentando y la suavidad que estás viendo. Esa desconexión será más significativa con DLSS 4, pero eso no significa de repente que, como resultado, haya un aumento masivo en la latencia. Es por eso que el nuevo e impresionante Reflex 2 de Nvidia no es necesario para DLSS 4; Al igual que DLSS 3, los desarrolladores sólo necesitan implementar la primera versión de Reflex para que DLSS 4 funcione.

Un modelo completamente nuevo

Una muestra de cómo funciona DLSS 4. — NVIDIA

Aclarar cómo funciona DLSS 4 puede hacerte creer que es más de lo mismo, pero no es así. DLSS 4 es una desviación muy significativa de DLSS 3, y eso se debe a que utiliza un modelo de IA completamente diferente. O, debería decir, modelos de IA. Como detalla Nvidia , DLSS 4 ejecuta cinco modelos de IA separados para cada fotograma renderizado cuando se utiliza superresolución, reconstrucción de rayos y generación de fotogramas múltiples, todos los cuales deben ejecutarse en cuestión de milisegundos.

Debido a lo que implica DLSS 4, Nvidia eliminó su anterior red neuronal convolucional, o CNN, y ahora utiliza un modelo de transformador de visión. Hay dos grandes cambios con un modelo de transformador. Primero está algo llamado "autoatención". El modelo puede rastrear la importancia de diferentes píxeles en múltiples fotogramas. Ser autorreferencial de esta manera debería permitir que el nuevo modelo se centre más en áreas problemáticas, como detalles finos con súper resolución que pueden mostrar brillo.

Los modelos de transformadores también son más escalables, lo que permite a Nvidia agregar muchos más parámetros a DLSS que con el enfoque CNN anterior. Según la empresa, el nuevo modelo de transformador tiene el doble de parámetros.

Como puede ver en los videos anteriores, Nvidia afirma que este nuevo modelo tiene mejor estabilidad y preservación de detalles finos en comparación con el enfoque CNN anterior. Estas mejoras tampoco son exclusivas de las GPU RTX serie 50. Todas las tarjetas gráficas RTX podrán aprovechar el nuevo modelo de transformador en juegos DLSS 4, al menos para las funciones compatibles con cada generación.

He visto DLSS 4 en acción un par de veces, pero la verdadera prueba para la función será cuando se lancen las GPU de próxima generación de Nvidia. Luego, podré evaluar cómo funciona la función en varios juegos y escenarios para ver cómo funciona. De todos modos, hay muchos cambios en la función y, según lo que Nvidia ha compartido hasta ahora, esos cambios funcionan para hacer que DLSS sea aún mejor.