MagicTime es un modelo que genera videos de alta calidad con cambios basados en descripciones de texto. Al aprender el conocimiento físico de los videos de lapso de tiempo, logra simular procesos de cambio con un alto grado de realismo. El modelo incluye tres componentes principales: MagicAdapter, Extracción de fotogramas dinámicos y Magic Text-Encoder, capaces de comprender eficazmente el proceso de cambio a partir del texto y generar el video correspondiente. Además, el equipo del proyecto ha desarrollado el conjunto de datos de video de lapso de tiempo ChronoMagic, que proporciona soporte para la generación de videos con cambios. Los resultados experimentales muestran que MagicTime ofrece un excelente rendimiento en la generación de videos dinámicos y realistas, ofreciendo una nueva perspectiva para la creación de simuladores de cambios en el mundo físico.