テキストから動画を高速生成するモデル。元のAnimateDiffと比べて10倍以上の性能を実現しています。
JCTN
超高速テキスト生成動画モデル、生成速度はオリジナルAnimateDiffの10倍以上
ByteDance