ビデオから音声(V2A)技術は、DeepMind社による革新的な技術です。ビデオピクセルと自然言語テキストプロンプトを組み合わせることで、画面上の動きと同期した豊かなサウンドスケープを生成します。この技術は、Veoなどのビデオ生成モデルと組み合わせることで、ビデオに劇的な音楽、リアルな効果音、またはビデオのキャラクターやトーンに合わせた会話を生成できます。また、アーカイブ資料やサイレント映画など、従来の素材に音声トラックを生成することもでき、幅広い創作の可能性を切り開きます。