10月9日、マスクが設立したxAIは、最新の動画生成モデル「Imagine v0.9」を発表しました。このモデルは、マルチモーダルAIクリエーション分野において大きな飛躍を遂げたことを示しています。初期バージョンであるv0.1と比較して、新モデルは画質、動作の自然さ、音声生成などの面で大幅に向上しています。

 3つの主要なアップグレード

  • 視覚的品質: 解像度がより高くなり、細部がより豊かで、全体的にプロの映画のような質感を持っています。

  • 動作生成: 人物や背景の動きがより滑らかで自然になり、動作のつなぎ目が明確に見えなくなりました。

  • 音声機能: オリジナルの音声生成が追加され、バックグラウンド音楽、会話、歌などの同時生成が可能です。

 ワンクリックで映画のような作品を作成

Imagine v0.9は、「即座に生成し、後処理なし」という完全な動画出力を実現します。スマートな構図やカメラの動きの制御などの機能をサポートしており、クリエイターが数秒で映画のような物語を持つ短編または長編動画を作成できます。

モデルの特徴的な機能

  • 同期音効果: 画面と音効果がフレーム単位で一致し、没入感を強化します。

  • ダイナミックカメラ効果: 自動的にスマートフォーカスや奥行き調整などの映画用のカメラ言語をサポートします。

  • 自然な会話と歌の生成: 角色が明瞭で感情に合わせた音声や歌を生成できます。

  • ダンスとリズム認識: AIが音楽のリズムを正確に捉え、協調的な動作を生成します。