MotionDirector é uma técnica que permite personalizar modelos de difusão de texto para vídeo para gerar vídeos com os movimentos desejados. Ela utiliza uma arquitetura de LoRAs de dois caminhos para desacoplar o aprendizado de aparência e movimento, e implementa uma nova perda temporal de desvio para reduzir o impacto da aparência nos objetivos de treinamento temporal. O método suporta diversos aplicativos a jusante, como a mistura de aparência e movimento de diferentes vídeos e a adição de animação a imagens individuais com movimentos personalizados.