近日,一款名为Qwen-TTS的语音合成模型有了新进展,其通过Qwen API完成了最新版本的更新,为用户带来了更加丰富的语音合成体验。
此次更新中,Qwen-TTS新增了对三种中文方言的支持,分别是北京话、上海话和四川话,进一步拓宽了其应用场景。该模型依托超过300万小时的大规模语料库进行训练,合成效果达到了人类级别的自然度和表现力。Qwen-TTS不仅能精准合成语音,还能根据输入文本自动调整韵律、节奏和情绪变化,让生成的语音更加真实、富有表达力。
目前,Qwen-TTS已经支持七种中英双语音色,包括Cherry、Ethan等标准音色,以及特别为方言设计的Dylan(北京话)、Jada(上海话)和Sunny(四川话)等音色。用户可以根据自己的需求,选择合适的音色进行语音合成。
在实际应用中,Qwen-TTS展现出了出色的性能。无论是描述日常生活的场景,还是表达复杂的情感,它都能生成自然流畅的语音。例如,在使用北京话音色的Dylan合成关于童年游戏的文本时,语音中充满了童趣和活力;而使用上海话音色的Jada合成关于生活琐事的对话时,则透露出一种地道的沪上风情。
Qwen-TTS的开发团队表示,未来他们将继续优化模型性能,并计划推出更多语言和语音风格,以满足用户日益多样化的需求。同时,他们也提供了简便的API接口,方便开发者将Qwen-TTS集成到自己的应用中。
百炼:https://help.aliyun.com/zh/model-studio/qwen-tts