アリババ通義ラボと中国科学技術大学が共同でFun-CineForgeプロジェクトをオープンソース化しました。映画の音声合成における口元同期、音色移行、感情表現などの課題に対して、エンドツーエンドの生産フローと大規模モデルの解決策を提供し、従来のAI音声合成では口元が一致しない、感情が硬い、複雑なシナリオに適応できないといった問題を解決することを目的としています。
アリババの通義ラボがFun-CineForgeモデルを公開・オープンソース化。AI音声の口形不一致、感情不足、複数キャラ音色の統一問題を解決。時間モダリティ概念を導入し、正確なタイムスタンプ制御で音声と映像の同期を実現。高品質データセット構築方法も公開。....
アリババの通義ラボが、世界初の映画級・多シーン対応のマルチモーダルAI音声モデル「Fun-CineForge」をオープンソース化。感情表現、環境音融合、口型同期などの技術的課題を克服し、映像業界の音声制作の知能化を推進。....
通義実験室がオープンソースのマルチモーダル大規模モデル「Fun-CineForge」を発表。映像・アニメにおけるAI音声の感情表現と口形同期の課題を解決し、合成音声と映像の唇の動きを高度に一致させ、リアルな吹き替えを実現。....