摩爾線程開源音頻理解大模型MooER摩耳
摩爾線程公司宣佈開源其自主研發的音頻理解大模型MooER,這是首個基於國產全功能GPU訓練和推理的大型開源語音模型。MooER在摩爾線程誇娥智算平臺上,僅用38小時完成了大規模音頻數據的訓練,展現出在中文、英文語音識別及中譯英語音翻譯上的優異性能,特別是在Covost2中譯英測試集中取得了接近工業級效果的25.2 BLEU分數。摩爾線程計劃進一步開源訓練代碼和基於更大數據集訓練的模型。MooER模型結構包括Encoder、Adapter和Decoder,並採用Paraformer和Qwen2-7B-instruct作爲初始化模塊,性能優於其他開源模型。此舉旨在爲開發者提供資源支持,促進人工智能領域的技術創新和應用。