MarDiniはMeta AI Researchが開発した動画拡散モデルです。マスク自己回帰(MAR)の利点を統一的な拡散モデル(DM)フレームワークに統合しています。このモデルは、任意の数のマスクフレームを任意のフレーム位置で利用して動画生成が可能であり、動画補間、画像から動画への生成、動画拡張など、様々な動画生成タスクに対応します。MarDiniは効率的な設計となっており、計算資源の大部分を低解像度計画モデルに割り当てることで、大規模での空間・時間的注意機構の実現を可能にしています。動画補間において新たな基準を打ち立て、数回の推論ステップで、より高価な高度な画像から動画へのモデルに匹敵する動画を効率的に生成します。