La última propuesta de la equipe de Li FeiFei, RTFM (Read The Field Model), se ha convertido en uno de los modelos más revolucionarios para la generación de mundos 3D. Este modelo puede realizar inferencias en tiempo real a velocidad de cuadros interactivos en una sola GPU NVIDIA H100, logrando así llevar la "generación de mundos 3D" del concepto a una etapa práctica.

El mayor punto fuerte de RTFM es su capacidad para operar en tiempo real con persistencia y coherencia 3D. El modelo no solo puede generar escenas 3D completas, sino que también mantiene estable la estructura geométrica, la posición y la apariencia de los objetos durante las interacciones, admitiendo efectos visuales complejos como reflejos, sombras, brillos especulares y halos, alcanzando un nivel de realismo comparable al de motores de juegos.

A diferencia de los modelos 3D anteriores que tenían una generación temporal limitada, RTFM introduce un "mecanismo de memoria persistente", lo que hace que el mundo virtual generado tenga continuidad a largo plazo. Los usuarios pueden explorar espacios 3D construidos por el modelo durante un tiempo ilimitado, y los escenarios no desaparecerán debido al cambio de perspectiva o acciones, logrando así un "mundo AI sostenible" en realidad.

La industria considera que el lanzamiento de RTFM marca un paso clave en la dirección de renderizado en tiempo real de alta fidelidad para los modelos de mundo de IA (World Model), proporcionando una nueva infraestructura para áreas como la realidad virtual, motores de juegos e inteligencia corporal en robótica.