AIBase
首頁
AI資訊
AI產品庫
模型廣場
MCP服务
AI服務
算力市場
AI應用指南
TW

AI資訊

查看更多

​DeepSeek 推出 NSA 技術:加速長上下文訓練與推理

在人工智能領域,DeepSeek 團隊於近日發佈了最新研究成果,推出了一種名爲 NSA(Native Sparse Attention)的創新稀疏注意力機制。這項技術的核心目標是提升長上下文訓練和推理的速度,特別是針對現代硬件進行了優化,使得訓練和推理的效率大幅提升。NSA 技術的推出,爲人工智能模型的訓練帶來了顯著的變化。首先,它通過一系列針對現代計算硬件特性的設計優化,顯著提升了推理速度,並有效降低了預訓練的成本。更重要的是,在提升速度和降低成本的同時,NSA 仍然保持了高水平的模型

30.9k 19 小時前
​DeepSeek 推出 NSA 技術:加速長上下文訓練與推理

模型

查看更多

Spark X1

Iflytek

Spark X1

$2

輸入tokens/百萬

-

輸出tokens/百萬

-

上下文長度

Spark Tiny

Iflytek

Spark Tiny

$2

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

MiniMax Text 01

Minimax

MiniMax Text 01

$1

輸入tokens/百萬

$8

輸出tokens/百萬

128

上下文長度

Spark Mini

Iflytek

Spark Mini

$2

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

Spark Max

Iflytek

Spark Max

$8

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

Spark Lite Patch

Iflytek

Spark Lite Patch

$2

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

Spark Mini Instruct

Iflytek

Spark Mini Instruct

$2

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖