深度求索计划于2月中旬推出新一代旗舰模型DeepSeek-V4,重点提升代码生成和长代码上下文处理能力。该模型在内部测试中表现已超越Claude和GPT系列,尤其在长代码提示处理方面优势明显。
12月1日,中国AI公司深度求索发布DeepSeek-V3.2系列模型,包括标准版和高计算增强版。该系列采用创新的稀疏注意力机制(DSA),首次实现细粒度稀疏注意力,有效降低长文本处理的计算成本。模型强化了Agent能力,旨在挑战GPT-5和Gemini 3.0 Pro等全球顶级AI模型。
DeepSeek悄然上线新版模型,疑似V3.2版本。虽然官方未明确型号,但Hugging Face平台出现对应命名空间,随后又显示404下架。V3系列此前已凭卓越性能和开源策略震动AI界,此次短暂亮相又神秘消失,更添悬念。
DeepSeek发布V3.1-Terminus版本,暗示V3系列或将收官。本次更新重点提升模型稳定性,修复了此前“极你太美”异常输出问题,通过优化语言处理机制解决不当回复缺陷。版本命名预示产品线重要转折,技术团队集中改进系统可靠性。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
Bytedance
$1.2
$3.6
4
Sci-fi-vy
DeepSeek-R1-0528是DeepSeek R1系列的小版本升级模型,通过增加计算资源和算法优化显著提升了推理深度和能力,在数学、编程等多个基准测试中表现出色。
rombodawg
EveryoneLLM系列模型由社区打造,为社区服务。这是一个基于deepseek-coder-33b-base微调而成的专用编码模型。