ControlMM es un marco de generación de movimiento corporal completo con funcionalidad de control multimodal plug-and-play, capaz de generar movimiento robusto en múltiples áreas, incluyendo texto a movimiento (Text-to-Motion), voz a gesto (Speech-to-Gesture) y música a baile (Music-to-Dance). El modelo presenta ventajas significativas en cuanto a controlabilidad, secuencialidad y razonabilidad del movimiento, ofreciendo una nueva solución de generación de movimiento para el campo de la inteligencia artificial.