百度在2025世界大会上发布文心5.0大模型,参数量达2.4万亿。该模型采用原生全模态技术,能统一处理文本、图像、音频和视频,具备出色的多模态理解、指令遵循、创意写作和智能规划能力,在推理与记忆方面表现突出。
Meta与新加坡国立大学合作开发SPICE强化学习框架,让两个AI代理相互对抗,在无人类监督下自我提升能力。该框架处于概念验证阶段,有望为未来动态适应环境的AI系统奠定基础,增强应对现实世界不可预测性的稳健性。
AMD于2025年11月11日收购AI推理初创公司MK1,旨在强化其在AI推理领域的战略布局。MK1的核心技术“Flywheel”与AMD的Instinct GPU深度优化,日处理超万亿token,显著提升推理能力。收购后,MK1团队将并入AMD AI事业部,助力公司巩固市场地位。
人工智能先驱李飞飞指出,当前AI竞赛过度关注语言模型参数,而忽视核心能力——空间智能。她强调,真正的通用人工智能必须掌握空间推理、物体关系与动态预测,否则将难以实现。空间智能是人类理解并驾驭物理世界的基础,是智能发展的关键引擎。
Google基于Gemini 3 Pro的AI图像编辑器,推理强,生成编辑能力出色
开放AI的GPT-OSS-120B和GPT-OSS-20B提供强大的推理能力,开发人员友好的功能,并采用Apache 2.0许可证,实现人工智能的民主化访问。
GPT 5是下一代AI模型,提供卓越的编码、数学和推理性能。
Grok 4是xAI推出的革命性AI模型,具备先进的推理能力、多模态功能和专业编码特性。
google
$9
Input tokens/M
$72
Output tokens/M
1M
Context Length
openai
$7.92
$31.68
200k
$2.16
$18
anthropic
$108
$540
chatglm
$4.03
$7.99
128k
$0.43
$1.01
131.1k
$432
nvidia
-
$21.6
deepseek
$3.96
$15.77
$15.98
alibaba
$0.72
moonshotai
$4.1
$16.56
xai
$2.88
Mungert
aquif-3.5系列中的顶尖模型,具备先进推理能力和100万标记的大上下文窗口,在多个基准测试中表现卓越,AAII综合得分达到60分。
inferencerlabs
基于MLX库实现的文本生成模型,支持多种量化方式推理,具备分布式计算能力,可在苹果硬件环境下高效运行。
mlx-community
Kimi-K2-Thinking 是由 mlx-community 从 moonshotai 原版模型转换而来的 MLX 格式大语言模型,采用 mlx-lm 0.28.4 版本进行转换,保留了原模型的思维链推理能力。
DavidAU
这是一个增强版的多模态视觉语言模型,基于Qwen3-VL-8B-Thinking模型,通过Brainstorm 20x技术扩展至12B参数,采用NEO Imatrix增强的GGUF量化。模型具备强大的图像理解、文本生成和多模态推理能力,在视觉感知、文本质量和创意场景方面都有显著提升。
unsloth
aquif-3.5系列是2025年11月3日发布的巅峰之作,包含Plus和Max两个版本,提供先进的推理能力和前所未有的100万标记上下文窗口,在各自类别中实现了最先进的性能。
noctrex
Aquif-3.5-Max-42B-A3B是一个420亿参数的大型语言模型,经过MXFP4_MOE量化处理,在保持高质量文本生成能力的同时优化了推理效率。该模型基于先进的混合专家架构,适用于多种自然语言处理任务。
Kimi K2 Thinking 是月之暗面(Moonshot AI)开发的最新一代开源思维模型,具有强大的深度推理能力和工具调用功能。该模型采用混合专家架构,支持原生INT4量化,拥有256k上下文窗口,在多个基准测试中表现出色。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力以及出色的智能体交互能力。
慧慧Qwen3-VL-4B思维消除模型的量化版本,基于Qwen3-VL-4B模型进行优化,专门设计用于消除思维链推理过程,可搭配最新的llama.cpp使用,提供高效的图像文本转文本处理能力。
Qwen3-VL-32B-Thinking是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文处理、空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。
Qwen3-VL是通义系列中最强大的视觉语言模型,在文本理解与生成、视觉感知与推理、上下文长度、空间和视频动态理解以及智能体交互能力等方面全面升级。该模型提供密集架构和混合专家架构,支持从边缘设备到云端的灵活部署。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,实现了全方位的综合升级,包括卓越的文本理解与生成能力、更深入的视觉感知与推理能力、更长的上下文长度、增强的空间和视频动态理解能力,以及更强的智能体交互能力。
GilbertAkham
这是一个基于DeepSeek-R1-Distill-Qwen-1.5B的多任务微调模型,通过LoRA适配器在多个数据集上进行训练,具备强大的多任务泛化和推理能力,能够处理广泛的自然语言和基于推理的任务。
Qwen3-VL是Qwen系列中最强大的视觉语言模型,具备卓越的文本理解与生成能力、深入的视觉感知与推理能力、长上下文支持、强大的空间和视频动态理解能力,以及出色的智能体交互能力。该版本为2B参数的思考增强版,专门优化了推理能力。
Qwen
Qwen3-VL-30B-A3B-Thinking是通义系列中最强大的视觉语言模型,具备出色的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。
Qwen3-VL-30B-A3B-Instruct是通义系列中最强大的视觉语言模型,采用混合专家模型架构,具备出色的文本理解与生成能力、深入的视觉感知与推理能力,支持256K长上下文和视频理解,可在多种设备上进行推理。
Qwen3-VL-2B-Thinking是Qwen系列中最强大的视觉语言模型之一,采用GGUF格式权重,支持在CPU、NVIDIA GPU、Apple Silicon等设备上进行高效推理。该模型具备出色的多模态理解和推理能力,特别增强了视觉感知、空间理解和智能体交互功能。
Qwen3-VL-8B-Thinking是通义千问系列中最强大的视觉语言模型,具备增强推理能力的8B参数版本。该模型在文本理解、视觉感知、空间理解、长上下文处理等方面全面升级,支持多模态推理和智能体交互。
Qwen3-VL是通义系列中最强大的视觉语言模型,具备出色的文本理解和生成能力、深入的视觉感知和推理能力、长上下文支持、强大的空间和视频动态理解能力,以及智能体交互能力。本仓库提供GGUF格式权重,支持在CPU、GPU等设备上高效推理。
MCP Reasoner是为Claude Desktop设计的推理增强工具,提供Beam Search和MCTS两种搜索策略,通过实验性算法提升复杂问题解决能力。
MCP推理器是为Claude Desktop设计的增强推理能力的工具,提供波束搜索和蒙特卡洛树搜索两种算法,并新增实验性策略模拟层以优化复杂问题解决。
MCP逻辑求解器是一个结合大型语言模型与形式化定理证明能力的强大推理系统,支持自然语言和一阶逻辑输入,通过Prover9/Mace4进行自动验证,并提供结构化推理和解释。
一个基于量子场计算模型的Claude多实例协同推理服务器,通过场一致性优化实现增强型AI推理能力。
Perplexity MCP Server是一个用Go编写的中间件服务器,为AI助手(如Claude和Cursor)提供无缝访问Perplexity API的能力,包括实时搜索和复杂推理功能。
一个为Cursor AI中的Claude提供高级推理能力的MCP服务器,包含多种推理方法如蒙特卡洛树搜索、束搜索和Transformer混合推理等。
MCP Chain of Draft Prompt Tool是一个增强LLM推理能力的工具,通过将标准提示转换为Chain of Draft或Chain of Thought格式,显著提高推理质量并减少token使用。
通过集成DeepSeek R1的推理引擎增强Claude的复杂任务处理能力
一个增强AI模型推理能力的MCP服务器,通过结构化检索和动态思维链提升问题解决能力。
基于Anthropic研究的MCP服务器,为Claude AI提供'think'工具能力,增强复杂推理任务处理。
该项目通过集成DeepSeek R1的推理引擎增强Claude的复杂任务处理能力,提供多步骤精确推理支持。
MCP代理工具适配器项目通过MCP协议实现模块化工具调用,支持Google ADK和LangGraph两种代理框架,提供动态推理和工具规划能力。
MCP Thought Server是一个为AI代理提供高级思维工具的服务,通过模型上下文协议(MCP)增强推理、规划和迭代优化能力。它包含结构化思维、迭代草稿和集成思维等工具,支持SQLite持久化和高级置信度评分系统,可配置环境变量以适应不同需求。
结合DeepSeek推理与Claude生成能力的MCP服务
MCP推理服务器为Claude Desktop提供系统化推理能力,支持束搜索和蒙特卡洛树搜索两种策略,适用于数学、逻辑等复杂问题求解。
官方实现的Anthropic'思考'工具MCP服务器,通过结构化思考显著提升Claude的推理能力
一个为Cursor AI中的Claude提供高级推理能力的MCP服务器,包含多种推理方法和自动迭代功能。
一个连接本地LLM与MCP服务器的TypeScript桥梁项目,提供Web界面使开源模型能使用类似Claude的工具能力,支持文件系统、网络搜索和复杂推理等功能。
Thoughtful Claude是一个增强Claude推理能力的MCP服务器,通过集成DeepSeek R1的高级推理引擎,为Claude提供复杂多步推理任务处理能力。
Perplexity MCP服务器是一个Go编写的中间件,为AI助手提供实时搜索和复杂推理能力