DeepSeekの次の世代技術がACL2025で最優秀論文賞を受賞。長文処理効率が11倍に向上!
DeepSeekの梁文峰博士チームと北京大学の共同研究がACL2025で最優秀論文賞を受賞。この研究では、ネイティブスパースアテンション(NSA)メカニズムを提案し、圧縮・選択的・スライドの3つの並列アテンションブランチを通じて、アルゴリズムとハードウェアの協調最適化を実現し、長文処理速度を11倍に向上させ、伝統的な全アテンションモデルを上回る性能を達成しました。NSAは最大100万トークンのコンテキスト長をサポートし、64kのテキスト処理においてデコード速度が11.6倍に向上し、27Bパラメータのモデルは複数のベンチマークテストで優れた結果を示しています。