MotionDirector est une technique permettant de personnaliser un modèle de diffusion texte-vers-vidéo afin de générer des vidéos avec les mouvements souhaités. Il adopte une architecture à double chemin LoRA pour dissocier l'apprentissage de l'apparence et du mouvement, et propose une nouvelle fonction de perte temporelle de débiaisement pour atténuer l'influence de l'apparence sur l'objectif d'entraînement temporel. Cette méthode prend en charge diverses applications en aval, telles que le mélange de l'apparence et du mouvement de différentes vidéos, et l'ajout d'animations à une seule image avec des mouvements personnalisés.