AI音声新技術MMAudio:動画またはテキストを入力して自動的に動画に音声効果を付与
イリノイ大学アーバナシャンペーン校、Sony AI、ソニーグループの研究チームが最近、MMAudioという新しい技術を発表しました。この技術はマルチモーダル連携学習を用いて、高品質な動画から音声合成を実現することを目指しています。MMAudioの中核となる革新は、動画とテキストの入力を利用して同期した音声を生成できる点であり、これにより音声生成の応用範囲が広がり、動画またはテキストを入力して動画の内容に合わせた音声効果を生成することが可能になります。MMAudioの設計は…