DeepSeek團隊推出Engram模塊,爲稀疏大語言模型引入“條件記憶軸”,旨在解決傳統Transformer處理重複知識時計算資源浪費的問題。該模塊作爲混合專家模型的補充,將N-gram嵌入技術融入模型,提升處理重複模式的效率。
nghuyong
ERNIE-Gram是一個通過顯式N-Gram掩碼語言建模進行預訓練的自然語言理解模型
mfleck
基於facebook/wav2vec2-xls-r-300m在Common Voice德語數據集上微調的語音識別模型,集成n-gram語言模型,詞錯誤率8.8%
imvladikon
基於facebook/wav2vec2-xls-r-300m微調的希伯來語語音識別模型,添加了n-gram語言模型增強