グーグルのチームは最近、静止画を動的なビデオに変換できる生成型画像ダイナミクス手法を発表しました。この手法は、自然な振動運動を含む実際のビデオから運動軌跡を抽出し、そのデータを用いてモデルが画像ダイナミクスの事前知識を学習します。
任意の入力画像に対して、モデルは各ピクセルの長期的な運動表現を予測し、それを運動軌跡に変換してビデオを生成します。さらに、ユーザーは画像内のオブジェクトとインタラクトすることもできます。画像上の点をドラッグすることで、それに対応する動きの反応を引き起こすことができます。
この手法は、一枚の画像から動的なビデオを生成するという新たな道を切り開き、幅広い応用が期待されます。