摩尔线程宣布开源音频理解大模型MooER
摩尔线程宣布开源其音频理解大模型MooER,成为首个基于国产全功能GPU的大型开源语音模型。MooER支持中英文语音识别与翻译,采用三部分模型结构,展现强大多语言处理能力。已开源推理代码与5000小时数据训练的模型,计划进一步开源训练代码与8万小时数据训练的增强版。在对比测试中,MooER-5K表现出色,中文CER为4.21%,英文WER为17.98%,特别是在Covost2zh2en测试集上,BLEU分数高达25.2,领先其他开源模型。基于8万小时数据训练的MooER-80k模型,中文CER降至3.50%,英文WER优化到12.66%,显示了巨大性能提升潜力。此次开源不仅展示了国产GPU在AI领域的应用实力,也为全球音频AI技术发展注入活力,期待MooER在语音识别、翻译等领域带来更多创新突破。