谷歌在Gemini应用中新增“立即回答”功能,旨在减少用户等待焦虑。用户可一键跳过深度思考环节,快速获取答案。该功能适用于Pro版和思考版模型,按钮旁会显示加载状态。
元宝平台2025年报告显示,混元大模型实现AI能力多维度升级。平台提供“快思考”与“深度思考”两种模式:超七成用户选择“快思考”,近半数问题首轮即可解决;“深度思考”适用于复杂场景,对话通常持续三轮以上,近半数能输出多步骤结构化内容。图像交互方面,混元T1-Vis模型于5月上线。
DeepSeek发布V3.2标准版与深度思考版。评测显示,V3.2在128k上下文场景下与GPT-5互有胜负;深度思考版在多项基准测试中与Gemini3Pro持平,并在IMO2025盲测中达到金牌分数线。核心升级是转正稀疏注意力技术,通过优化token路由,显著降低了长文本的计算复杂度、显存占用,并提升了推理速度,首次在开源模型中实现了百万token的单卡推理能力。
上汽荣威在广州车展发布M7DMH中大型轿车,搭载与字节跳动豆包合作的“深度思考大模型”,实现智能车机交互。车辆能理解复杂指令(如调节空调和座椅加热)、自动播放安抚音乐、记忆日程并规划路线,从机械工具转变为贴心出行伙伴。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
深度推理翻译模型,通过长思考链优化神经机器翻译。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
Mungert
基于RWKV-7架构的轻量级语言模型,采用flash-linear attention格式,具备多语言支持和深度思考能力,适用于文本生成任务。
Qwen 4B模型的三种量化版本(Q8_0),分别支持64K、128K和256K的上下文长度,专为长文本生成和深度思考任务优化
soob3123
深度思考模型是一款专为分析性任务设计的文本生成模型,能够在处理敏感查询时保持分析中立,确保在有争议的话题上维持事实完整性。
Vijayendra
DeepThinkerv2是一个具备深度数学推理能力的大语言模型,通过递归思考模式和多重验证机制提升解题准确性。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
fla-hub
基于Flash线性注意力机制的RWKV-7 g1模型,支持多语言处理并具备深度思考能力
DevQuasar
DeepHermes是一个基于Llama-3架构的8B参数语言模型预览版,专注于深度思考和长链式推理能力。
这是一个实验性构建的大型语言模型,结合了Dolphin3.0-R1-Mistral-24B与Brainstorm 40x技术,参数量达45B,具备强大的深度推理和思考能力。模型支持32k上下文长度,采用CHATML模板格式,特别优化了推理过程的详细输出。