吉利汽車智能語音新突破:自研大模型超越業界標杆
吉利汽車近日在語音合成領域取得重大突破,其自主研發的HAM-TTS大模型性能超越了行業標杆VALL-E,引起業界廣泛關注。這款名爲"星睿"的AI大模型在發音準確性、自然度和說話人相似度等關鍵指標上均實現了顯著提升。HAM-TTS模型採用基於token的零樣本文字轉語音分層聲學建模技術,在智能座艙中大幅提升了用戶交互體驗。在相同的4億參數條件下,HAM-TTS模型的字符錯誤率比VALL-E下降了1.5%;而在8億參數的完全體上,字符錯誤率更是直降2.3%。在風格一致性、音調一致性和整體得分上,HAM-TTS模型