在2025vivo开发者大会上,蓝心语言大模型升级,智能助手小V实现重大进步。核心改进包括重构意图中控,提升用户意图理解准确性,能拆解复杂任务并优化执行步骤。新增深度思考能力,使小V提供更具洞察力和高质量的智能问答服务。
火山引擎发布豆包大模型1.6-vision,这是该家族首个具备工具调用能力的视觉深度思考模型。它增强了多模态理解和推理能力,支持Responses API,核心优势包括通过工具调用实现精准视觉理解,能将图像融入思维链,支持定位、剪裁、点选等图像操作功能。
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,基于Ling-flash-2.0-base深度优化。该模型总参数达100亿,推理时仅激活6.1亿参数,通过高效激活机制实现强大计算能力并显著节省资源。在多项高难度基准测试中表现优异,标志着人工智能领域的重要进展。
豆包App在视觉推理领域迎来重大升级,其图片分析功能现已支持深度思考模式,为用户带来前所未有的智能体验。用户只需在深度思考模式下拍摄或上传一张图片,豆包便能迅速对图片进行放大、裁剪等精细处理,并支持图片搜索功能,实现边想边搜,从而进一步提升搜索结果的准确性。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
google
$2.16
Input tokens/M
$18
Output tokens/M
1M
Context Length
anthropic
$21.6
$108
200k
$0.72
$2.88
bytedance
$4
$16
128k
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
Mungert
基于RWKV-7架构的轻量级语言模型,采用flash-linear attention格式,具备多语言支持和深度思考能力,适用于文本生成任务。
Vijayendra
DeepThinkerv2是一个具备深度数学推理能力的大语言模型,通过递归思考模式和多重验证机制提升解题准确性。
THUDM
GLM-4-Z1-32B-0414是具备深度思考能力的320亿参数推理模型,在数学、代码和逻辑类任务上表现优异
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
fla-hub
基于Flash线性注意力机制的RWKV-7 g1模型,支持多语言处理并具备深度思考能力
DevQuasar
DeepHermes是一个基于Llama-3架构的8B参数语言模型预览版,专注于深度思考和长链式推理能力。