摩爾線程宣佈開源音頻理解大模型MooER
摩爾線程宣佈開源其音頻理解大模型MooER,成爲首個基於國產全功能GPU的大型開源語音模型。MooER支持中英文語音識別與翻譯,採用三部分模型結構,展現強大多語言處理能力。已開源推理代碼與5000小時數據訓練的模型,計劃進一步開源訓練代碼與8萬小時數據訓練的增強版。在對比測試中,MooER-5K表現出色,中文CER爲4.21%,英文WER爲17.98%,特別是在Covost2zh2en測試集上,BLEU分數高達25.2,領先其他開源模型。基於8萬小時數據訓練的MooER-80k模型,中文CER降至3.50%,英文WER優化到12.66%,顯示了巨大性能提升潛力。此次開源不僅展示了國產GPU在AI領域的應用實力,也爲全球音頻AI技術發展注入活力,期待MooER在語音識別、翻譯等領域帶來更多創新突破。