AnimateLCM-SVD-xt est un nouveau modèle de génération d'image à vidéo capable de produire des vidéos de haute qualité et cohérentes en très peu d'étapes. Grâce à la distillation de connaissances de cohérence et à des techniques d'apprentissage de correspondance stéréoscopique, le modèle génère des vidéos plus fluides et cohérentes tout en réduisant considérablement la charge de calcul. Ses caractéristiques clés incluent : 1) Génération de vidéos de 25 images de résolution 576x1024 en 4 à 8 étapes ; 2) Réduction de la charge de calcul de 12,5 fois par rapport aux modèles de diffusion vidéo classiques ; 3) Génération de vidéos de haute qualité, sans besoin de guide de classificateur supplémentaire.