Cómo la IA generativa creará juegos con “mundos más amplios, más grandes y más profundos”
De todos los casos de uso de IA generativa que existen, no puedo pensar en uno más significativo que los videojuegos. Claro, hemos visto a personas crear juegos simples a partir de GPT-4 , pero seguramente asumí que una tecnología tan poderosa también se estaba discutiendo en los niveles más altos de desarrollo de juegos .
Para tener una idea de cuán grande podría ser este cambio, quería hablar con alguien que realmente entienda cómo se hacen los juegos a nivel técnico. Marc Whitten, vicepresidente sénior y gerente general de Unity Create, es sin duda una de esas personas. Está particularmente entusiasmado con la forma en que la IA podría transformar el desarrollo de juegos, y hablamos sobre cómo las herramientas que podrían permitir esa revolución ya están llegando a los creadores.
Tiempo de creación más rápido
Los juegos requieren una gran cantidad de tiempo y esfuerzo para desarrollarse, pero la mayor parte de ese tiempo se dedica a crear todo el contenido del juego. Whitton dice que si miras un estudio AAA común de 300 personas, alrededor del 80% de ellas se dedican a crear contenido. La IA puede acelerar ese proceso drásticamente.
Whitton proporcionó un claro ejemplo de ello: Ziva Face Trainer. Ziva es una empresa que Unity adquirió a principios de 2022 y ha estado trabajando en su herramienta Face Trainer durante poco más de dos años. Toma un modelo, lo entrena en un gran conjunto de emociones y movimientos, y genera algo utilizable.
¿Cuánto tiempo ahorra esto? Whitton dice que el rigging de alto nivel de un personaje puede llevar de cuatro a seis meses a un equipo de cuatro a seis artistas: diez años más o menos.”
Con Ziva Face Trainer, los desarrolladores "le dan una malla y entrenamos esa malla contra un gran conjunto de datos… para que obtenga en cinco minutos un modelo de plataforma que le permita ejecutarlo en tiempo real". La tecnología Ziva también se está utilizando mucho . Está detrás de la deformación del traje en Spider-Man: Miles Morales, así como del Troll en el tráiler de Senua's Saga: Hellblade 2 . Probablemente lo hayas visto incluso en algunas películas y programas de televisión: Captain Marvel, John Wick 3 y Game of Thrones están en la lista.
Eso no debería ser una sorpresa. El aprendizaje automático y las técnicas de procedimiento (como herramientas como SpeedTree) no son exactamente nuevas en el mundo del desarrollo de juegos. Es cierto que una mayor investigación sobre los modelos de IA puede conducir a procesos de creación aún más eficientes, pero estamos viendo un cambio con la IA generativa. Estamos hablando de modelos de lenguaje extenso (LLM) como GPT-4 y modelos de difusión como Midjourney , y pueden cambiar radicalmente los juegos que vemos.
cambiando el juego
Whitton dice que la esperanza con la IA es hacer que los juegos sean "diez a la tercera mejores", lo que significa juegos que sean diez veces más rápidos, diez veces más fáciles y diez veces más baratos de desarrollar. Sin embargo, el resultado de eso no es una avalancha de los mismos juegos que tenemos. Whitton cree que los resultados son "mundos más amplios, más grandes y más profundos".
Pedí un ejemplo y Whitton reflexionó sobre cómo se vería Skyrim si tuviera un modelo de IA generativa detrás. Todos hemos escuchado el meme de la "flecha en la rodilla" del juego, pero Whitton imaginó un juego en el que esa línea desechable significaba algo más.
“Bueno, ¿y si cada uno de esos guardias en realidad tuviera un gráfico tipo Myers-Briggs? Un poco de historia de fondo y, francamente, una historia de fondo que podría haber sido afectada por eso. ¿Qué ha pasado con el personaje en el camino? Y luego un modelo de IA para generar lo que sería una respuesta racional que surja de eso, dados todos esos eventos particulares”.
Estamos viendo algún esfuerzo allí con juegos como The Portopia Serial Murder Case, que, sin rodeos, no han presentado el mejor caso para la IA en los juegos . Sin embargo, no es difícil ver el potencial, especialmente en juegos más grandes con NPC que no tienen misiones establecidas o diálogos exhaustivos.
También hay mucho potencial en los juegos estilo sandbox. Whitton imaginó un juego al estilo GTA en el que "vas a la casa de empeño y reclutas a la persona detrás del escritorio y, ya sabes, tal vez el creador del juego nunca pensó en eso como una posibilidad debido a algo más que sucedió en el juego." Whitton también pensó en Scribblenauts, excepto en un mundo en el que realmente podrías hacer cualquier cosa y asignarle cualquier propiedad.
El problema en este momento es hacer que eso realmente funcione, como lo demuestra The Portopia Serial Murder Case. Whitten fue uno de los miembros fundadores del equipo de Xbox en Microsoft y ayudó a liderar el impulso de Kinect. Acerca de Kinect, Whitten dijo: "Les diría a todos que funciona increíble si estoy sentado a tu lado". Necesitaba solicitarlo de una manera específica y, si se desviaba, no funcionaría.
Ese es el gran problema que enfrenta la IA en su conjunto, con asistentes inteligentes como Alexa que solo operan dentro de un rango estrecho. Los LLM cambian esa dinámica y permiten cualquier indicación, y eso es lo emocionante de crear mundos de juego más profundos. Sin embargo, todavía hay un camino para llegar allí.
“Si pones la herramienta por ahí… [los creadores] alcanzarán los límites y dirán: 'Bueno, eso no es divertido'. Pero luego van a ir a buscar el espacio en el que nadie está pensando”, dijo Whitten.
Con el despliegue de más herramientas, podríamos ver algunos experimentos iniciales con IA durante el próximo año. Ya lo hemos hecho en algunos casos, como el popular AI Dungeon 2. Pero para hacer posible este tipo de mundo inmersivo a escala, se necesita un intermediario. Y para Unity, ese intermediario es Barracuda.
la barracuda
Unity incluye una biblioteca de inferencia de redes neuronales llamada Barracuda. Como explica Whitten, "es un motor de inferencia que le permite impulsar la difusión u otras formas de contenido generativo en tiempo de ejecución en el dispositivo sin tener que ir a la nube y a un ritmo de alto rendimiento".
Oh sí, rendimiento. Por mucho que nos guste hablar de que la IA puede cambiar el contenido para siempre, hay un costo computacional masivo (hay una razón por la que se necesitaron decenas de miles de GPU para construir ChatGPT ). Barracuda permite que esos modelos se ejecuten en su CPU o GPU para que no tenga que ir a la nube, lo que, para que conste, sería una gran fuente de dinero para los desarrolladores.
Unity está trabajando en más funciones para Barracuda, y Whitten dice que "el interés de la comunidad de creadores de juegos ha sido extraordinariamente alto". Es la clave que hace posible la IA generativa en el desarrollo y diseño de juegos, especialmente sin requerir ningún hardware específico.
Whitten dice que el equipo quiere comenzar a "construir técnicas que permitan a los creadores comenzar a enfocarse realmente en una parte importante y central de su diseño de juego, no 'Oh, esto realmente disminuirá mi audiencia si diseño para ello'". Unreal Engine, por su parte, tiene una herramienta similar (la bien llamada herramienta NeuralNetworkInference, o NNI).
Estas bibliotecas, cuando se encuentran con grandes modelos generativos de IA y una aceleración en el desarrollo de contenido, pueden conducir a una "explosión de creatividad", según Whitten. Y eso es algo por lo que emocionarse por el futuro de los juegos.
Este artículo es parte de ReSpec , una columna quincenal continua que incluye discusiones, consejos e informes detallados sobre la tecnología detrás de los juegos de PC.