DeepSeek梁文鋒博士團隊與北大合作的論文獲ACL2025最佳論文獎。該研究提出原生稀疏注意力(NSA)機制,通過壓縮、選擇性和滑動三條並行注意力分支,實現算法與硬件協同優化,將長文本處理速度提升11倍,性能超越傳統全注意力模型。NSA支持100萬tokens上下文長度,在64k文本處理中解碼速度提升11.6倍,27B參數模型在多項基準測試中表現優異,爲AI長文本處理開闢了新方向。