Recientemente, Kunlun Tech anunció oficialmente el lanzamiento de su nuevo modelo Matrix-Game, que destaca por tener más de mil millones de parámetros y se convierte en el primer modelo de inteligencia espacial de código abierto en la industria. Este hito marca un avance importante en la tecnología de generación de mundos interactivos. Matrix-Game no solo es compatible con el popular juego "Minecraft", sino que también está diseñado específicamente para generar contenido de alta calidad y control preciso en entornos abiertos.
El núcleo del modelo Matrix-Game radica en sus tres componentes principales. En primer lugar, el conjunto de datos "Matrix-Game-MC" ha sido construido de forma autónoma y contiene una gran cantidad de videos del juego Minecraft, incluidas videoclips sin etiquetas de gran escala y datos de video controlables con señales de control. Esto permite a los desarrolladores modelar de manera eficiente los patrones dinámicos e interactivos en entornos complejos. En segundo lugar, el modelo principal de Matrix-Game utiliza avanzadas técnicas de modelos de difusión para generar videos interactivos coherentes y controlables según las entradas del usuario (como operaciones del teclado y ratón), combinando efectos visuales, consistencia temporal y razonabilidad física. Esto significa que los jugadores pueden disfrutar de experiencias interactivas más realistas dentro del juego.
Fuente de la imagen: Imagen generada por IA, proveedor de licencias Midjourney
Por último, Matrix-Game introduce el sistema de evaluación GameWorld Score, un nuevo estándar de evaluación para mundos interactivos de juegos que cuantifica el rendimiento del modelo desde múltiples dimensiones, como la calidad visual, la calidad temporal, la controllabilidad de los movimientos y la comprensión de las reglas físicas. Este sistema llena el vacío de la falta de marcos de evaluación sistemáticos en este campo, ayudando a los desarrolladores a comprender mejor las ventajas y desventajas del modelo.
Matrix-Game puede realizar generación controlable en diversas escenas de Minecraft, permitiendo que los personajes realicen comportamientos dinámicos en ambientes como desiertos o bosques. Los usuarios solo necesitan seguir instrucciones de control simples para experimentar acciones como el movimiento, salto y ataque del personaje. Además, este modelo soporta la generación de videos largos en modo autoregresivo, asegurando la transición fluida entre acciones y perspectivas, lo que establece una base sólida para experiencias inmersivas y la creación de contenido creativo.
El modelo Matrix-Game de Kunlun Tech no solo representa una innovación tecnológica, sino también un hito en el desarrollo de juegos, esperando amplias aplicaciones en el futuro.