DeepSeek团队推出Engram模块,为稀疏大语言模型引入“条件记忆轴”,旨在解决传统Transformer处理重复知识时计算资源浪费的问题。该模块作为混合专家模型的补充,将N-gram嵌入技术融入模型,提升处理重复模式的效率。
nghuyong
ERNIE-Gram是一个通过显式N-Gram掩码语言建模进行预训练的自然语言理解模型
mfleck
基于facebook/wav2vec2-xls-r-300m在Common Voice德语数据集上微调的语音识别模型,集成n-gram语言模型,词错误率8.8%
imvladikon
基于facebook/wav2vec2-xls-r-300m微调的希伯来语语音识别模型,添加了n-gram语言模型增强