DeepSeek发布V3.2标准版与深度思考版。评测显示,V3.2在128k上下文场景下与GPT-5互有胜负;深度思考版在多项基准测试中与Gemini3Pro持平,并在IMO2025盲测中达到金牌分数线。核心升级是转正稀疏注意力技术,通过优化token路由,显著降低了长文本的计算复杂度、显存占用,并提升了推理速度,首次在开源模型中实现了百万token的单卡推理能力。
上汽荣威在广州车展发布M7DMH中大型轿车,搭载与字节跳动豆包合作的“深度思考大模型”,实现智能车机交互。车辆能理解复杂指令(如调节空调和座椅加热)、自动播放安抚音乐、记忆日程并规划路线,从机械工具转变为贴心出行伙伴。
OpenAI发布GPT-5.1,标志AI竞赛进入"情商融合"新阶段。模型重点强化情绪价值、个性化交互与人性化表达,解决用户反馈的"AI冰冷"问题。采用双模型架构:Instant模式快速响应,Thinking模式深度思考。全球分批推送中,付费用户3个月内可继续使用GPT-5过渡。
月之暗面发布并开源Kimi K2Thinking模型,显著提升智能代理和推理能力。该模型能自主边思考边使用工具,无需用户干预,支持长达300轮工具调用和多轮深度思考,旨在高效处理复杂任务。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
深度推理翻译模型,通过长思考链优化神经机器翻译。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
Mungert
基于RWKV-7架构的轻量级语言模型,采用flash-linear attention格式,具备多语言支持和深度思考能力,适用于文本生成任务。
Qwen 4B模型的三种量化版本(Q8_0),分别支持64K、128K和256K的上下文长度,专为长文本生成和深度思考任务优化
soob3123
深度思考模型是一款专为分析性任务设计的文本生成模型,能够在处理敏感查询时保持分析中立,确保在有争议的话题上维持事实完整性。
Vijayendra
DeepThinkerv2是一个具备深度数学推理能力的大语言模型,通过递归思考模式和多重验证机制提升解题准确性。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
fla-hub
基于Flash线性注意力机制的RWKV-7 g1模型,支持多语言处理并具备深度思考能力
DevQuasar
DeepHermes是一个基于Llama-3架构的8B参数语言模型预览版,专注于深度思考和长链式推理能力。
这是一个实验性构建的大型语言模型,结合了Dolphin3.0-R1-Mistral-24B与Brainstorm 40x技术,参数量达45B,具备强大的深度推理和思考能力。模型支持32k上下文长度,采用CHATML模板格式,特别优化了推理过程的详细输出。