未来は既に到来!アリババの新音声技術CosyVoiceでAIの音声がより人間味あふれるものに
アリババが最近発表したCosyVoice音声合成モデルとSenseVoice音声認識モデルは、FunAudioLLMフレームワークを構成し、人と機械のインタラクション体験の向上を目指しています。CosyVoiceは、そのリアルな音声生成能力により、異なる性別、年齢、個性的声音を模倣し、感情やスタイルを追加し、笑い声、咳、呼吸などの自然な特徴をシミュレートすることもできます。SenseVoiceは、高精度の多言語音声認識、感情認識、オーディオイベント検出に焦点を当てており、50以上の言語をサポートしています