阿里巴巴通义大模型开源“百聆”系列语音模型重大升级。新模型仅需3秒录音即可无缝切换9种语言和18种方言,支持普通话、粤语、日语、英语等,并能模拟开心、愤怒等多种情感。其中Fun-CosyVoice3模型改进显著,首包延迟降低50%,中英混说准确率大幅提升。