未來已來!阿里新語音技術CosyVoice讓AI說話更有人味兒
阿里巴巴最新推出的CosyVoice語音合成模型和SenseVoice語音識別模型,共同構成了FunAudioLLM框架,旨在提升人機交互體驗。CosyVoice以其逼真的聲音生成能力,能模仿不同性別、年齡和個性的聲音,添加情感和風格,甚至模擬自然特徵如笑聲、咳嗽和呼吸。SenseVoice則專注於高精度的多語言語音識別、情感識別和音頻事件檢測,支持超過50種語言,反應速度快。FunAudioLLM的語音到語音翻譯功能實現了快速而準確的跨語言交流,同時,它在情感交互方面的表現也極爲出色,能根據用戶情緒做出恰當的迴應。對於文學愛好者,FunAudioLLM的有聲書製作技術能提供富有表現力的朗讀體驗。這些技術突破預示着人機交互的未來將更加自然、人性化,爲教育、娛樂、客戶服務等領域帶來革命性變化。