阿里の通義万相チームがAIモデル「Wan2.2-S2V」を発表予定。映像と音声を同期生成可能で、歌唱付きAI動画作成が可能に。従来の視覚生成を超える多モーダルAI技術の進展。....
Wan-AI
Wan2.2-S2V-14Bは、音声駆動の映画レベルのビデオ生成に特化したハイブリッドエキスパート(MoE)モデルです。入力された音声、参照画像、およびテキストプロンプトに基づいて高品質のビデオコンテンツを生成でき、480Pと720Pの解像度をサポートし、複雑な動き生成と映画レベルの美学効果を備えています。