元宝平台2025年报告显示,混元大模型实现AI能力多维度升级。平台提供“快思考”与“深度思考”两种模式:超七成用户选择“快思考”,近半数问题首轮即可解决;“深度思考”适用于复杂场景,对话通常持续三轮以上,近半数能输出多步骤结构化内容。图像交互方面,混元T1-Vis模型于5月上线。
元宝年度报告显示,接入DeepSeek后,用户与AI互动显著增长。超1/3对话能延续两轮以上,深度与快思考交互占比3:7。近半数回答以图文或视频形式呈现。用户提问热情持续攀升,12月14日提问量达全年峰值,较年初大幅增长。
诺贝尔奖得主莱维特探讨智能时代未来方向,强调智能的复杂性远超想象。他分享与AI工具深度互动的经验,提出生物、文化、人工智能及个人智能的多元见解,引导思考人类如何把握智能时代的机遇与挑战。
DeepSeek-V3.2正式版与极致推理版同步发布,支持网页端、App、API一键切换,性能再证“开源最强”。最大亮点是首次实现“思考过程”与“工具调用”深度融合,支持两种模式并行:思考模式可进行长链条推理,工具调用模式则能高效执行任务。
首个为人脑思维打造的工具,处理知识,让思考自由展开、关联与演化。
满血版DeepSeek,支持深度思考和联网搜索,免费不限次数,助力多种任务完成。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
深度推理翻译模型,通过长思考链优化神经机器翻译。
Openai
-
Input tokens/M
Output tokens/M
Context Length
Anthropic
$105
$525
200
Alibaba
$1
$10
256
$2
$20
Bytedance
$0.8
Moonshot
$4
$16
$0.15
$1.5
Tencent
32
$8
Deepseek
$12
128
$0.4
$0.75
$8.75
$70
400
$0.63
$3.15
131
Chatglm
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
Mungert
基于RWKV-7架构的轻量级语言模型,采用flash-linear attention格式,具备多语言支持和深度思考能力,适用于文本生成任务。
Qwen 4B模型的三种量化版本(Q8_0),分别支持64K、128K和256K的上下文长度,专为长文本生成和深度思考任务优化
soob3123
深度思考模型是一款专为分析性任务设计的文本生成模型,能够在处理敏感查询时保持分析中立,确保在有争议的话题上维持事实完整性。
Vijayendra
DeepThinkerv2是一个具备深度数学推理能力的大语言模型,通过递归思考模式和多重验证机制提升解题准确性。
THUDM
GLM-4-Z1-32B-0414是具备深度思考能力的320亿参数推理模型,在数学、代码和逻辑类任务上表现优异
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
LGAI推出的EXONE系列推理模型,采用新矩阵和极致量化技术,具备32k上下文窗口,专注于深度思考和推理任务。
fla-hub
基于Flash线性注意力机制的RWKV-7 g1模型,支持多语言处理并具备深度思考能力
DevQuasar
DeepHermes是一个基于Llama-3架构的8B参数语言模型预览版,专注于深度思考和长链式推理能力。
这是一个实验性构建的大型语言模型,结合了Dolphin3.0-R1-Mistral-24B与Brainstorm 40x技术,参数量达45B,具备强大的深度推理和思考能力。模型支持32k上下文长度,采用CHATML模板格式,特别优化了推理过程的详细输出。
该项目实现了一个基于多智能体系统(MAS)的高级顺序思考流程,通过Agno框架构建并由MCP提供服务。相比简单的状态跟踪方法,它利用协调的专门代理进行深度分析和问题分解,从被动的思维记录器进化为主动的思维处理器。
基于Gemini API的深度思考与分析服务器,提供多角度问题分析、批判性与创造性思维整合、代码质量评估及优化建议,支持技术决策与解决方案设计。