DestacadaTecnología

Así es la nueva tecnología de Microsoft, Muse, el modelo de IA generativo que busca revolucionar el diseño de videojuegos

Una de sus posibles aplicaciones: revivir juegos clásicos

Microsoft acaba de presentar su primer World and Human Action Model (WHAM), conocido ya como Muse. Este modelo generativo de inteligencia artificial está diseñado para crear gráficos de videojuegos, acciones del mando o ambos a partir de un breve prompt inicial y sus aplicaciones en el mundillo prometen ser muchas.

La innovación, fruto del trabajo conjunto de los equipos de Microsoft Research Game Intelligence y Teachable AI Experiences en colaboración con Ninja Theory de Xbox Games Studios, promete transformar la forma en la que se diseñan y experimentan por parte del jugador los videojuegos.

Cómo funciona

El funcionamiento de Muse se basa en el modo world model, en el que el modelo predice la evolución del juego a partir de una secuencia inicial de apenas un segundo de jugabilidad humana, es decir, 10 fotogramas. A partir de esta breve introducción, Muse genera tanto los gráficos como las correspondientes acciones del mando que siguen la lógica interna del videojuego.

Cuanto más parecida es la secuencia generada a la jugabilidad real, mayor es la capacidad del modelo para capturar y reproducir las complejidades del entorno virtual.

De menos a más

El equipo de Microsoft se enfrentó al desafío de mejorar la capacidad de su modelo de inteligencia artificial (IA) para procesar grandes cantidades de datos rápidamente. Usaron poderosas unidades de procesamiento (GPUs) para entrenarlo, comenzando con una tecnología más antigua (las V100) y luego avanzando a una más potente (las H100), lo que les permitió trabajar con más datos a una mayor velocidad y, como resultado, obtener imágenes de mejor calidad.

Además, tuvieron que decidir cómo entender y procesar las acciones de los controles de los videojuegos y las imágenes generadas. Al principio, las imágenes que producían no eran muy detalladas (solo 128×128 píxeles), pero con el tiempo lograron mejorar la calidad de las imágenes solicitadas, pasando a una resolución más alta de 300×180 píxeles, lo que permite una visualización más clara de las secuencias de juego generadas por la IA.

La IA necesita datos, y en cantidades

Muse se entrena utilizando datos reales de jugabilidad. En concreto, se ha empleado más de 1000 millones de imágenes y acciones de mando extraídas de siete años de juego continuo en Bleeding Edge, el videojuego multijugador de Ninja Theory lanzado en 2020. Este extenso conjunto de datos ha permitido que Muse aprenda la dinámica y la estructura del mundo virtual, lo que se traduce en secuencias de juego generadas que son consistentes y realistas durante periodos de hasta dos minutos.

Consistencia, diversidad y persistencia

Para evaluar la calidad de Muse, se han definido tres métricas fundamentales: consistencia, diversidad y persistencia. La consistencia mide la capacidad del modelo para mantener una secuencia de juego que respete la dinámica y las reglas del entorno virtual; la diversidad evalúa la variedad de secuencias posibles a partir de un mismo prompt inicial, y la persistencia se refiere a la habilidad del modelo para incorporar cambios introducidos por el usuario sin perder la coherencia global.

Con esta herramienta, los usuarios pueden cargar un prompt visual, por ejemplo, una imagen promocional del juego Bleeding Edge, y observar cómo Muse genera múltiples continuaciones. Además, la implementación de la capacidad de persistencia permite introducir modificaciones en la secuencia (como la adición de un nuevo personaje) y que el modelo integre de forma coherente estos cambios en el resto de la secuencia generada.

La preservación de juegos clásicos en el punto de mira

El impacto de Muse va más allá del diseño de videojuegos. Peter Lee, presidente de Microsoft Research, destacó en su blog la similitud entre el aprendizaje del lenguaje que se observa en modelos como ChatGPT y la capacidad de Muse para comprender y reproducir la mecánica de las interacciones en entornos 3D.

Fatima Kardar, vicepresidenta corporativa de gaming AI en Microsoft, señaló además que esta tecnología podría ser utilizada para preservar y actualizar juegos clásicos, optimizándolos para funcionar en cualquier dispositivo, lo que representa un gran avance para la conservación del patrimonio digital.

En línea con esta filosofía, Microsoft ha decidido poner a disposición de la comunidad tanto estas herramientas como el WHAM Demonstrator a través de Azure AI Foundry, fomentando la colaboración y el desarrollo de nuevas aplicaciones basadas en Muse. Este enfoque de código abierto permitirá a investigadores y desarrolladores explorar, aprender y construir sobre los avances obtenidos, impulsando una nueva era en el diseño iterativo y creativo de videojuegos.

Fuente: lavanguardia.com

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *