OpenAI发布GPT-5.4模型,实现推理、编程与智能体工作流统一。新增“思维”模式,AI在回答前展示思考计划,用户可实时介入调整。同时增强深度搜索能力。
OpenAI发布GPT-5.4系列模型,包括标准版、专注复杂逻辑的推理版GPT-5.4Thinking及高性能优化版GPT-5.4Pro。其API版本支持100万个标记的上下文窗口,为OpenAI史上最大,显著提升了处理能力和效率。
联想在MWC 2026上推出ThinkBook模块化AI PC概念机,通过MagicBay接口实现硬件自由组合,打破传统笔记本形态限制,支持用户按需扩展功能,体现了“随需应变”的创新设计理念。
联想在MWC上推出模块化概念笔记本ThinkBook Modular AI PC Concept,打破传统硬件固定形态,实现硬件“按需定制”。其最大亮点是键盘与机身可分离的模块化设计,提供极致灵活性。
AI驱动的图像矢量化与涂鸦创作,将提示转化为可编辑SVG和视频
Gemini 2.0 Flash Thinking Experimental 是一款增强推理模型,能够展示其思考过程以提升性能和可解释性。
谷歌开发的AI模型,提供推理能力更强的响应。
让Claude在回应前进行深入思考
Alibaba
$2
输入tokens/百万
$20
输出tokens/百万
-
上下文长度
Bytedance
$0.8
$8
256
$4
$16
128
$3
$9
Google
Baidu
Moonshot
$200
131
John1604
Qwen3 VL 4B Thinking 是一个支持图像到文本以及文本到文本转换的多模态模型,具有4B参数规模,能够满足多种图文交互需求。
Intel
DeepMath是一个40亿参数的数学推理模型,基于Qwen3-4B Thinking构建,结合了微调的大语言模型与沙盒化Python执行器。它能够为计算步骤生成简洁的Python代码片段,显著减少错误并缩短输出长度。
allenai
Olmo 3是由Allen Institute for AI (Ai2)开发的一系列语言模型,包含7B和32B两种规格,有Instruct和Think两种变体。该模型基于Transformer架构,具有长链思维能力,可有效提升数学和编码等推理任务的表现。
Olmo 3是由Allen Institute for AI开发的开源语言模型系列,包含7B和32B两种规格,分为指令(Instruct)和思考(Think)两种变体。该模型具有出色的长链思维能力,能够显著提升数学和编码等推理任务的表现。
Olmo 3是由Allen Institute for AI开发的全新语言模型家族,包含7B和32B两种规模,有指令(Instruct)和思维(Think)两种变体。该模型采用长链式思维提升数学和编码等推理任务表现,旨在推动语言模型科学发展。
inferencerlabs
Kimi - K2 - Thinking 3.825bit MLX 是一款用于文本生成的量化模型,通过不同的量化方式在测试中取得不同的困惑度表现,其中q3.825bit量化能达到1.256的困惑度。
Olmo 3 32B Think SFT是基于Transformer架构的自回归语言模型,在长链思维推理方面表现出色,特别擅长处理数学和编码等复杂推理任务。该模型在Dolma 3数据集上进行预训练,并在Dolci数据集上进行监督微调。
Olmo 3是Allen Institute for AI (Ai2)开发的全新32B参数语言模型家族,包含Base、Instruct和Think等变体。该模型基于Dolma 3数据集训练,支持65,536的长上下文处理,旨在推动语言模型科学发展。模型完全开源,遵循Apache 2.0许可证。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
GeneralAnalysis
GA Guard Thinking是General Analysis开发的40亿参数开源审核模型,专门用于检测和防止语言模型生成不安全、不合规的内容。该模型在七个安全类别上进行训练,能够有效识别非法活动、仇恨言论、个人信息泄露等风险内容。
Olmo 3是由Allen Institute for AI开发的全新7B参数语言模型系列,基于Transformer架构,在Dolma 3数据集上训练,旨在推动语言模型科学发展。模型提供Base、Instruct和Think等多种变体,支持最长65,536的上下文长度。
QuantFactory
这是基于llama.cpp对Qwen3-4B-v0.4-deepresearch-no-think-4进行量化处理后的版本,专门针对深度研究场景优化,移除了think机制,采用GGUF格式提供更高效的推理性能。
lmstudio-community
这是Qwen3 235B A22B Thinking 2507模型的量化版本,通过llama.cpp的量化技术实现,可在资源有限环境下高效运行文本生成任务,是LM Studio社区模型亮点计划的一部分。
launch
ThinkPRM-7B是一款基于R1-Distill-Qwen-7B架构的生成式过程奖励模型,专门用于对推理过程进行逐步验证。它通过生成明确的验证思维链来评估数学解题、代码生成等推理任务的每一步正确性,具有数据效率高、可解释性强的特点。
AM Thinking v1是由A-M团队开发的基于Qwen 2.5-32B-Base的大语言模型,增强推理能力,支持132k tokens的上下文长度。
Vinnnf
Thinkless是一个通过强化学习训练的大语言模型,能够自适应选择简答或长链推理模式,显著降低推理计算成本。
无思框架(Thinkless)是一种可学习框架,使大模型能根据任务复杂度和自身能力,自适应选择简短推理或长链推理。
KissanAI
针对印度农业的气候智能型农业(CRSA)推理增强模型的实验性研究预览版
simone-papicchio
基于Qwen2.5-Coder-7B-Instruct微调的文本转SQL推理模型,增强LLM在文本转SQL任务中的推理能力
ThinkPRM-1.5B是基于R1-Distill-Qwen-1.5B架构的生成式过程奖励模型,能够通过生成验证思维链对推理过程进行逐步验证。
一个基于MCP协议的结构化思维服务器,通过定义思考阶段帮助分解复杂问题并生成总结
结合DeepSeek推理与Claude生成的两阶段AI对话服务
一个为Claude设计的结构化思考工具MCP服务器,用于提升复杂问题解决能力
Think MCP是一个实现MCP服务器的项目,提供'think'工具以支持AI代理在复杂任务中进行结构化推理,灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略,适用于工具输出分析、策略密集环境和顺序决策场景。
Sequential Thinking MCP是一个支持AI代理进行高级元认知和动态反思问题解决的MCP服务器,通过虚拟记录思维和计划来指导复杂任务的分步执行。
Sequential Thinking MCP是一个提供结构化思维过程的MCP服务器,通过分步解决问题、管理假设并与Recall区块链集成来存储思维日志,支持动态调整和反思性思考。
Smart-Thinking是一个先进的MCP服务器,提供多维、自适应且可自验证的AI推理框架,采用基于图形的架构实现复杂思维连接,支持跨平台运行并与多种MCP客户端兼容。
一个基于TypeScript的非常规思维服务器,通过生成挑战传统思维的非常规想法,帮助解决复杂问题。
基于Anthropic研究的MCP服务器,为Claude AI提供'think'工具能力,增强复杂推理任务处理。
Deepseek Thinker MCP Server是一个提供Deepseek推理内容的MCP服务,支持OpenAI API和本地Ollama两种模式,可集成到AI客户端中。
官方实现的Anthropic'思考'工具MCP服务器,通过结构化思考显著提升Claude的推理能力
Think Server的MCP服务器配置指南
为Claude AI提供结构化思考工具的服务
一个基于TypeScript的MCP服务器,帮助LLM构建思维导图进行结构化思考,包含质量评分、阶段管理、分支探索和记忆管理功能。
ThinkingCap是一个基于模型上下文协议的多智能体研究服务器,可并行运行多个LLM提供商并综合其响应,实现全面的多角度分析。
基于分支思维的MCP服务器工具,支持多线程思考导航和智能洞察生成
MCP Server MAS Sequential Thinking 是一个专注于增强顺序思维过程的服务器环境项目,提供模块化设计、可扩展性和多语言支持,适用于教育、研究和应用开发。
基于Gemini API的思维分析服务器,提供复杂问题分解与思考能力
Sequential Thinking Ultra是一个基于MCP协议的高级顺序思维服务器,集成了Ultra Think方法论,提供结构化的问题解决能力。核心功能包括分步处理、质量验证、偏差检测和资源管理,支持自动查询重写和元推理检查点,适用于复杂问题的逐步分析和优化决策。
MAXential Thinking MCP 是一个为AI模型提供结构化推理工具的服务,支持思维链的分支、修订、合并和导航,实现透明、可追溯的思考过程。