AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

​DeepSeek 推出 NSA 技术:加速长上下文训练与推理

在人工智能领域,DeepSeek 团队于近日发布了最新研究成果,推出了一种名为 NSA(Native Sparse Attention)的创新稀疏注意力机制。这项技术的核心目标是提升长上下文训练和推理的速度,特别是针对现代硬件进行了优化,使得训练和推理的效率大幅提升。NSA 技术的推出,为人工智能模型的训练带来了显著的变化。首先,它通过一系列针对现代计算硬件特性的设计优化,显著提升了推理速度,并有效降低了预训练的成本。更重要的是,在提升速度和降低成本的同时,NSA 仍然保持了高水平的模型

29.9k 1 小时前
​DeepSeek 推出 NSA 技术:加速长上下文训练与推理

模型

查看更多

Spark X1

Iflytek

Spark X1

$2

输入tokens/百万

-

输出tokens/百万

-

上下文长度

Spark Tiny

Iflytek

Spark Tiny

$2

输入tokens/百万

-

输出tokens/百万

8

上下文长度

MiniMax Text 01

Minimax

MiniMax Text 01

$1

输入tokens/百万

$8

输出tokens/百万

128

上下文长度

Spark Mini

Iflytek

Spark Mini

$2

输入tokens/百万

-

输出tokens/百万

8

上下文长度

Spark Max

Iflytek

Spark Max

$8

输入tokens/百万

-

输出tokens/百万

8

上下文长度

Spark Mini Instruct

Iflytek

Spark Mini Instruct

$2

输入tokens/百万

-

输出tokens/百万

8

上下文长度

Spark Lite Patch

Iflytek

Spark Lite Patch

$2

输入tokens/百万

-

输出tokens/百万

8

上下文长度

AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商务合作网站地图