通義ラボは、Fun-CosyVoice3.5およびFun-AudioGen-VDの2つの音声大規模モデルを発表しました。'FreeStyle'の自然言語指令により、1文で自由に音声を生成する深層的なインタラクティブ性を実現しています。Fun-CosyVoice3.5にはタイ語、インドネシア語などの4つの言語が追加され、多言語での再現力と細分化された表現能力が向上しています。
アリババ通義ラボは、Fun-CosyVoice3.5とFun-AudioGen-VDの2つの音声生成モデルをリリースしました。自由な「FreeStyle」コマンドをサポートしており、ユーザーは自然言語による記述で音声スタイルを制御したり、オーディオシーンを構築できます。Fun-CosyVoice3.5は多言語の再現と細やかな制御に特化しており、CosyVoiceのアップグレード版です。