DeepSeek梁文锋博士团队与北大合作的论文获ACL2025最佳论文奖。该研究提出原生稀疏注意力(NSA)机制,通过压缩、选择性和滑动三条并行注意力分支,实现算法与硬件协同优化,将长文本处理速度提升11倍,性能超越传统全注意力模型。NSA支持100万tokens上下文长度,在64k文本处理中解码速度提升11.6倍,27B参数模型在多项基准测试中表现优异,为AI长文本处理开辟了新方向。