Metaの新フレームワークVideoJAM:AIビデオモデルの運動能力と物理能力を向上
動画生成分野では、近年目覚ましい進歩を遂げていますが、既存の生成モデルは、複雑な動き、ダイナミクス、物理現象をリアルに捉えることが依然として困難です。この限界は、主に従来のピクセル再構成目標に起因しており、この方法は外観のリアリティを高めることに偏り、運動の一貫性を無視することが多いためです。この問題を解決するために、Metaの研究チームは、モデルによる結合外観・運動表現の学習を促進することで、ビデオ生成モデルに有効な運動能力を注入することを目的とした、VideoJAMという新しいフレームワークを提案しました。