DeepSeek创始人梁文锋近日宣布,新一代旗舰模型DeepSeek V4将于2026年4月下旬发布。在此之前,产品已引入分层模式:快速模式主打日常对话和即时响应,支持图片和文件文字识别;专家模式则专注于复杂逻辑和深度思考,能力更强。
网易有道推出“有道宝库”AI知识库产品,主打文档深度管理与智能再创作。该产品支持全格式文档上传,用户可通过对话提问获取信息,实现从被动存储到主动生成的跨越,旨在打造“会思考”的数字资料库。
亚马逊AWS正开发AI智能体,旨在自动化执行部分部门职能,这些部门恰是此前裁员重灾区。该技术或将替代数千名专家,深入网络安全等核心领域,引发对人力资源与技术替代的深度思考。
OpenAI发布GPT-5.4模型,实现推理、编程与智能体工作流统一。新增“思维”模式,AI在回答前展示思考计划,用户可实时介入调整。同时增强深度搜索能力。
首个为人脑思维打造的工具,处理知识,让思考自由展开、关联与演化。
满血版DeepSeek,支持深度思考和联网搜索,免费不限次数,助力多种任务完成。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
深度推理翻译模型,通过长思考链优化神经机器翻译。
Openai
-
Input tokens/M
Output tokens/M
Context Length
Anthropic
$105
$525
200
Alibaba
$1
$10
256
$2
$20
Bytedance
$0.8
Moonshot
$4
$16
$0.15
$1.5
Tencent
32
$8
Deepseek
$12
128
$0.4
$0.75
$8.75
$70
400
$0.63
$3.15
131
Chatglm
DavidAU
这是一个基于Qwen3-Coder-30B-A3B-Instruct的混合专家模型,拥有540亿参数和100万上下文长度。模型通过三步合并和Brainstorm 40X优化,具备强大的编程能力和通用场景处理能力,特别集成了思考模块,能够在回答前进行深度推理。
Mungert
基于RWKV-7架构的轻量级语言模型,采用flash-linear attention格式,具备多语言支持和深度思考能力,适用于文本生成任务。
Qwen 4B模型的三种量化版本(Q8_0),分别支持64K、128K和256K的上下文长度,专为长文本生成和深度思考任务优化
soob3123
深度思考模型是一款专为分析性任务设计的文本生成模型,能够在处理敏感查询时保持分析中立,确保在有争议的话题上维持事实完整性。
Vijayendra
DeepThinkerv2是一个具备深度数学推理能力的大语言模型,通过递归思考模式和多重验证机制提升解题准确性。
THUDM
GLM-4-Z1-32B-0414是具备深度思考能力的320亿参数推理模型,在数学、代码和逻辑类任务上表现优异
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
LGAI推出的EXONE系列推理模型,采用新矩阵和极致量化技术,具备32k上下文窗口,专注于深度思考和推理任务。
fla-hub
基于Flash线性注意力机制的RWKV-7 g1模型,支持多语言处理并具备深度思考能力
DevQuasar
DeepHermes是一个基于Llama-3架构的8B参数语言模型预览版,专注于深度思考和长链式推理能力。
这是一个实验性构建的大型语言模型,结合了Dolphin3.0-R1-Mistral-24B与Brainstorm 40x技术,参数量达45B,具备强大的深度推理和思考能力。模型支持32k上下文长度,采用CHATML模板格式,特别优化了推理过程的详细输出。
该项目实现了一个基于多智能体系统(MAS)的高级顺序思考流程,通过Agno框架构建并由MCP提供服务。相比简单的状态跟踪方法,它利用协调的专门代理进行深度分析和问题分解,从被动的思维记录器进化为主动的思维处理器。
基于Gemini API的深度思考与分析服务器,提供多角度问题分析、批判性与创造性思维整合、代码质量评估及优化建议,支持技术决策与解决方案设计。