英伟达发布开放式多模态模型Nemotron 3 Nano Omni,整合视频、音频、图像和文本推理能力,采用30B-A3B混合专家架构,集成视觉与音频编码器,无需额外感知模型,显著提升大规模推理效率,在复杂文本处理等领域表现出色。
荣耀宣布智能助理YOYO接入DeepSeek-V4大模型,成为安卓首个整合该技术的智能体。升级聚焦性能、上下文理解与推理效率三大核心,显著提升复杂指令与长文本对话处理能力,标志着移动端AI体验进入更高阶段。
DeepSeek发布新一代旗舰模型V4,采用细分化策略推出Flash与Pro两个版本,分别覆盖轻量高频应用和复杂推理任务。此举不仅满足不同场景需求,还以极具竞争力的定价重塑AI商业化基准,整合了原有deepseek-chat与deepseek-reasoner模型。
腾讯发布并开源了全新AI大模型“混元Hy3 preview”,这是混元系列中最智能的模型,升级涵盖复杂推理、指令遵循、上下文学习、代码处理和智能体等领域。该模型采用快思考与慢思考结合的混合专家架构,拥有2950亿参数,旨在提升整体性能和智能化水平。
全新多模态推理模型,支持图文输入、文字输出,具备高精度图像感知与复杂推理能力。
o1-pro 模型通过强化学习提升复杂推理能力,提供更优答案。
通过去噪生成模型进行空间推理,解决复杂分布下的视觉任务。
QwQ-32B 是一款强大的推理模型,专为复杂问题解决和文本生成设计,性能卓越。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$7
$35
Google
$2.1
$17.5
$21
$0.7
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
$8
$240
52
Moonshot
Bytedance
TeichAI
本模型是基于Qwen3-4B-Thinking-2507基础模型,使用高推理难度的Gemini 3 Pro预览数据集进行蒸馏训练得到的模型。它专注于提升在编码和科学领域的复杂推理能力,通过特定数据集的训练,旨在将大型模型(如Gemini 3 Pro)的推理能力高效地迁移到较小规模的模型中。
squ11z1
Hypnos i1-8B 是基于 Nous Hermes 3(Llama 3.1 8B)的专业推理模型,专注于复杂逻辑、思维链推理和数学问题求解。该模型在混合量子-经典机器学习领域进行了独特探索,通过引入量子噪声注入提升了模型的创造力和推理能力。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款专为智能推理和稳健代码生成设计的高保真指令调优模型。它基于Qwen3-8B架构,采用高秩LoRA配置训练,擅长在编码前进行规划,非常适合复杂的软件工程任务。
这是一个基于Qwen3 30B A3B模型,在Claude Sonnet 4.5高推理难度数据集上训练的蒸馏模型。该模型专门针对复杂推理任务进行优化,在编码和科学领域表现出色,具备较强的逻辑推理能力。
allenai
Olmo-3-32B-Think-DPO是Allen AI开发的32B参数语言模型,采用直接偏好优化(DPO)训练,具备长链式思维推理能力,在数学、编码等复杂推理任务上表现优异。
Olmo 3 32B Think SFT是基于Transformer架构的自回归语言模型,在长链思维推理方面表现出色,特别擅长处理数学和编码等复杂推理任务。该模型在Dolma 3数据集上进行预训练,并在Dolci数据集上进行监督微调。
noctrex
Jan-v2-VL是一款具有80亿参数的视觉语言模型,专为在真实软件环境(如浏览器和桌面应用程序)中执行长时、多步骤任务而设计。它将语言推理与视觉感知相结合,能够遵循复杂指令、维持中间状态,并从轻微执行错误中恢复。
prithivMLmods
Jan-v2-VL 是一个拥有80亿参数的视觉语言模型,专为在浏览器和桌面应用程序等真实软件环境中执行长周期、多步骤任务而设计。它将语言推理与视觉感知紧密结合,能够遵循复杂指令、维持中间状态并从轻微执行错误中恢复,实现稳定且持续的任务完成。
hasanbasbunar
Lodos-24B-Instruct-2510是基于Mistral-Small-3.2-24B-Instruct-2506微调的土耳其语大语言模型,使用TRL框架进行全监督微调,专门针对土耳其语指令遵循任务优化,支持长文本生成和复杂推理。
Mungert
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究代理模型,结合了AI反馈强化学习(RLAIF)和强大的推理框架,能够在工具增强的大语言模型中实现可靠、对齐和可扩展的研究级推理,适用于复杂的多步骤研究工作流程。
deepcogito
Cogito v2.1是经过指令微调的6710亿参数混合专家生成式模型,采用开放许可发布,支持商业用途。该模型能有效解决复杂的推理和指令遵循问题,支持30多种语言和128k上下文长度。
Hugguf
Qwen3-VL-30B-A3B-Instruct是基于Qwen3-VL-30B模型的多模态视觉语言模型,支持图像和文本的联合理解与生成任务。该模型采用先进的视觉语言融合架构,能够处理复杂的多模态推理任务。
jackcloudman
Qwen3-Next-80B-A3B-Thinking 是通义千问团队推出的新一代思考型大语言模型,采用创新的混合注意力机制和高稀疏MoE架构,在保持高效推理的同时具备强大的复杂推理能力,原生支持262K上下文长度。
PokeeAI
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究智能体,结合基于AI反馈的强化学习(RLAIF)与推理框架,能够执行复杂的多步骤研究工作流程,包括自我修正、验证和综合分析。
NexaAI
Qwen3-VL-8B-Thinking是阿里云Qwen团队开发的80亿参数多模态大语言模型,专为深度多模态推理设计,支持视觉理解、长上下文处理和结构化思维链生成,在复杂推理任务中表现出色。
Open-Bee
Bee-8B是一个先进的全开源多模态大语言模型,专注于数据质量,旨在缩小与专有模型的性能差距。通过使用高质量的Honey-Data-15M语料库和先进的数据处理管道HoneyPipe,在复杂推理等方面展现了卓越性能。
nightmedia
LFM2-8B-A1B-qx86-hi-mlx是基于MLX格式的高效推理模型,从LiquidAI/LFM2-8B-A1B转换而来。该模型采用混合专家架构,在推理任务中表现出卓越的效率,特别擅长复杂逻辑推理任务,同时支持多语言处理。
zai-org
GLM-4.6-FP8是智谱AI推出的新一代文本生成模型,相比GLM-4.5在多个关键方面有显著改进。该模型具有更长的上下文窗口、卓越的编码性能、高级推理能力和更强大的智能体功能,能够处理更复杂的任务。
foreverlasting1202
QuestA是一个通过问题增强方法提升大语言模型推理能力的创新框架。它在强化学习训练过程中融入部分解决方案,显著提升了模型在数学推理等复杂任务上的表现,特别是在小参数模型上实现了最优结果。
Qwen
Qwen3-VL是通义系列最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频理解能力,以及出色的智能体交互能力。此版本为235B参数的思考增强版,支持更复杂的推理任务。
Perplexity MCP Server是一个智能研究助手,利用Perplexity的AI模型自动分析查询复杂度并选择最佳模型处理请求,支持搜索、推理和深度研究三种工具。
MCP Reasoner是为Claude Desktop设计的推理增强工具,提供Beam Search和MCTS两种搜索策略,通过实验性算法提升复杂问题解决能力。
MCP推理器是为Claude Desktop设计的增强推理能力的工具,提供波束搜索和蒙特卡洛树搜索两种算法,并新增实验性策略模拟层以优化复杂问题解决。
Perplexity MCP Server是一个智能研究助手,利用Perplexity的AI模型提供自动查询复杂度检测和最优模型路由功能,支持搜索、推理和深度研究三种工具。
Think MCP是一个实现MCP服务器的项目,提供'think'工具以支持AI代理在复杂任务中进行结构化推理,灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略,适用于工具输出分析、策略密集环境和顺序决策场景。
一个实现顺序思维协议的强大MCP服务器,提供结构化的问题解决方法,将复杂问题分解为可管理步骤,支持迭代优化和多种推理路径。
Perplexity MCP Server是一个用Go编写的中间件服务器,为AI助手(如Claude和Cursor)提供无缝访问Perplexity API的能力,包括实时搜索和复杂推理功能。
Thoughtbox是一个AI思维辅助工具,通过分步思考、修订和分支推理等功能,帮助用户分解复杂问题并优化解决方案
Smart-Thinking是一个先进的MCP服务器,提供多维、自适应且可自验证的AI推理框架,采用基于图形的架构实现复杂思维连接,支持跨平台运行并与多种MCP客户端兼容。
通过集成DeepSeek R1的推理引擎增强Claude的复杂任务处理能力
基于Anthropic研究的MCP服务器,为Claude AI提供'think'工具能力,增强复杂推理任务处理。
该项目通过集成DeepSeek R1的推理引擎增强Claude的复杂任务处理能力,提供多步骤精确推理支持。
MCP推理服务器为Claude Desktop提供系统化推理能力,支持束搜索和蒙特卡洛树搜索两种策略,适用于数学、逻辑等复杂问题求解。
Atom of Thoughts是一个基于分解-收缩机制的推理框架,通过将复杂问题分解为原子单元进行系统化解决,提供完整版和轻量版两种工具。
一个连接本地LLM与MCP服务器的TypeScript桥梁项目,提供Web界面使开源模型能使用类似Claude的工具能力,支持文件系统、网络搜索和复杂推理等功能。
一个基于Python实现的顺序思维MCP服务器,通过分步思考流程解决复杂问题,支持思维修订、分支推理和动态调整思考步骤。
Atom of Thoughts是一个基于分解-收缩机制的推理框架,通过将复杂问题分解为原子化思考单元进行系统化验证,提供完整版和轻量版两种工具。
Adaptive Graph of Thoughts是一个基于Neo4j图数据库的智能科学推理框架,通过图结构实现复杂的科学推理任务,支持与Claude Desktop等AI应用集成。
MindBridge是一个AI模型路由服务器,支持多LLM提供商,实现智能模型调度与协作,适用于复杂推理任务和多模型工作流。
Thoughtful Claude是一个增强Claude推理能力的MCP服务器,通过集成DeepSeek R1的高级推理引擎,为Claude提供复杂多步推理任务处理能力。