吉利汽车智能语音新突破:自研大模型超越业界标杆
吉利汽车近日在语音合成领域取得重大突破,其自主研发的HAM-TTS大模型性能超越了行业标杆VALL-E,引起业界广泛关注。这款名为"星睿"的AI大模型在发音准确性、自然度和说话人相似度等关键指标上均实现了显著提升。HAM-TTS模型采用基于token的零样本文字转语音分层声学建模技术,在智能座舱中大幅提升了用户交互体验。在相同的4亿参数条件下,HAM-TTS模型的字符错误率比VALL-E下降了1.5%;而在8亿参数的完全体上,字符错误率更是直降2.3%。在风格一致性、音调一致性和整体得分上,HAM-TTS模型