Sesame 發佈 CSM 語音模型:跨越“恐怖谷”,逼真程度驚豔全球
Sesame 公司最新推出的語音合成模型“Conversational Speech Model”(簡稱 CSM)近日在 X 平臺上引發熱議,被譽爲“像真人說話一樣的語音模型”。這款模型以其驚豔的自然度和情感表達能力,不僅讓用戶“已經無法分辨”其與人類的區別,還宣稱成功跨越了語音領域的“恐怖谷效應”。隨着演示視頻和用戶反饋的傳播,CSM 正迅速成爲 AI 語音技術的新標杆。跨越“恐怖谷”:CSM 的技術突破“恐怖谷效應”是指當人工合成的語音或形象接近真實人類但仍存細微差異時,會引發人類的不適感。Sesame 通