MagicTime est un modèle capable de générer des vidéos de haute qualité et dynamiques à partir de descriptions textuelles. En apprenant les lois physiques des vidéos de timelapse, il simule des processus de changement avec un réalisme élevé. Ce modèle comprend trois composants principaux : MagicAdapter, Dynamic Frames Extraction et Magic Text-Encoder. Il permet de comprendre efficacement le processus de changement à partir du texte et de générer la vidéo correspondante. L'équipe du projet a également développé un jeu de données vidéo de timelapse dédié, ChronoMagic, pour soutenir la génération de vidéos dynamiques. Les résultats expérimentaux montrent que MagicTime excelle dans la génération de vidéos dynamiques et réalistes, ouvrant de nouvelles perspectives pour la création de simulateurs de changement du monde physique.