DeepSeek、NSA技術を発表:長文脈の学習と推論を加速
人工知能分野において、DeepSeekチームは先日、NSA(Native Sparse Attention)と呼ばれる革新的なスパースアテンション機構に関する最新の研究成果を発表しました。この技術の中心的な目的は、長文脈の学習と推論の速度を向上させることであり、特に最新のハードウェア向けに最適化されており、学習と推論の効率が大幅に向上します。NSA技術の発表は、人工知能モデルの学習に大きな変化をもたらしました。まず、最新の計算ハードウェアに合わせた一連の...