Perplexity公司宣布,其智能体系统Perplexity Computer将于今夏升级,引入“混合智能体推理”模式。该模式能根据任务类型和数据敏感度,在本地紧凑模型与云端前沿模型间智能切换,平衡隐私保护与计算性能,提升复杂任务执行效率。
谷歌DeepMind推出AI框架“AlphaProof Nexus”,通过四级智能体架构协同,在数学研究领域取得重大突破,成功解开两道悬而未决56年的埃尔德什难题。系统从基础模型与Lean编译器循环交互入手,逐步提升推理复杂度,展现了AI在形式化验证与数学推理中的强大潜力。
根据国家数据局数据,到2025年中国AI训练与推理数据总量预计达199.48EB,同比增长42.86%。其中推理数据首次超越训练数据,达101.34EB,显示AI应用在各行业的广泛性。同时,系统软件和AI产生的数据量将达26.92ZB。
Canonical宣布Ubuntu 26.04 LTS将重点集成AI功能,旨在打造情境感知的智能操作系统。工程副总裁Jon Seager表示,Ubuntu不会转型为纯AI产品,而是通过本地推理和智能工作流等技术,增强现有桌面与服务器系统的能力,实现更强大的用户体验。
3FS是一个高性能分布式文件系统,专为AI训练和推理工作负载设计。
DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构,专为大规模 AI 模型优化设计。
自动化科学研究的多智能体图推理系统。
基于 AI 的知识处理平台,执行商业任务的简单 API
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$7
$35
Google
$2.1
$17.5
$21
$105
$0.7
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
Moonshot
Bytedance
$0.8
32
vanta-research
Scout是VANTA Research基于Google Gemma 3 4B Instruct架构微调的专业语言模型,在约束感知推理和自适应问题解决方面表现出色,擅长侦察式情报收集、系统问题分解和自适应解决方案生成。
GenMedLabs
XTTS v2 GGUF 是一款专为移动设备优化的内存高效文本转语音系统,采用C++推理引擎,实现超低内存使用和快速加载。
nvidia
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,采用FP4数据类型进行优化,通过TensorRT-LLM进行高效推理。该模型专为NVIDIA GPU加速系统设计,适用于AI Agent系统、聊天机器人、RAG系统等多种AI应用场景,支持全球范围内的商业和非商业使用。
NVIDIA Qwen3-14B FP4 模型是阿里云 Qwen3-14B 模型的量化版本,采用优化的 Transformer 架构,是一个自回归语言模型。该模型使用 TensorRT Model Optimizer 进行量化,将权重和激活量化为 FP4 数据类型,可在 NVIDIA GPU 加速系统上实现高效推理。
Mungert
MiniCPM4.1-8B GGUF是专为端侧设备设计的高效大语言模型,在模型架构、训练数据、训练算法和推理系统四个关键维度进行了系统创新,实现了极致的效率提升。支持65,536个标记的上下文长度和混合推理模式。
cpatonn
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA全新训练的大语言模型,专为推理和非推理任务设计的统一模型。它采用Mamba2-Transformer混合架构,支持多语言,具备可控的推理能力,用户可通过系统提示控制模型的推理过程显示。模型在多项基准测试中表现优异,已可商用。
NVIDIA Nemotron Nano 12B v2 是由 NVIDIA 从零开始训练的大语言模型,专为推理和非推理任务设计。该模型采用混合架构,结合 Mamba-2 和注意力层,支持多语言处理,并可通过系统提示控制推理能力。
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
danielkty22
TARS-SFT-7B是一个基于监督微调的安全推理模型,作为强化学习训练的基础模型,专门设计用于增强AI系统的安全性。该模型从Qwen2.5-7B-Instruct开始训练,通过推理过程作为自适应防御机制来提升模型的安全性能。
MiniCPM4-8B是专为端侧设备设计的高效大语言模型,通过模型架构、训练数据、训练算法和推理系统四个维度的创新,实现了极致的效率提升。
openbmb
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个关键维度实现极致的效率提升。
MiniCPM4是专为端侧设备设计的高效大语言模型,通过系统创新在模型架构、训练数据、训练算法和推理系统四个维度实现极致效率提升,在端侧芯片上可实现超5倍的生成加速。
inclusionAI
AReaL是由蚂蚁科技集团开发的异步强化学习训练系统,专为大型推理模型设计,支持快速训练和前沿性能。
Ricky06662
VisionReasoner是基于强化学习的统一视觉感知与推理模型,通过强化学习框架将视觉感知和推理任务整合到一个统一的系统中,为视觉领域的复杂任务提供了创新的解决方案。
tonyli8623
基于谷歌Gemma-3 27B微调的大型语言模型,专注思维链推理和代码生成任务,优化了GPU显存和系统内存管理。
Can111
M1-32B是基于Qwen2.5-32B-Instruct微调的320亿参数大语言模型,专为提升多智能体系统中的推理、讨论和决策能力而优化。
Xkev
Llama-3.2V-11B-cot 是一个能够进行自发、系统性推理的视觉语言模型,基于 LLaVA-CoT 框架开发。
dmis-lab
猫鼬-8B是基于Meta的Llama-3-8B-Instruct模型开发的医疗AI系统,通过合成数据集进行指令微调,具备高级医学推理能力,专门用于解决复杂医学问题。
or4cl3ai
Aiden T5 是一款具有互联网访问能力和信念-愿望-意图(BDI)系统的突破性 transformers 模型,结合了 transformer 语言模型的强大能力与通过互联网及自身认知进行学习和推理的能力。
fxmarty
这是一个仅用于测试目的的随机权重模型,主要用于验证模型加载、推理流程和系统集成功能。
PageIndex MCP是一个基于推理的无向量RAG系统,通过MCP协议将文档的树状索引暴露给LLM,使Claude等平台能够像人类专家一样通过结构推理检索PDF文档信息,无需向量数据库。
MCP逻辑求解器是一个结合大型语言模型与形式化定理证明能力的强大推理系统,支持自然语言和一阶逻辑输入,通过Prover9/Mace4进行自动验证,并提供结构化推理和解释。
一个基于强化学习的智能电商对话代理系统,集成了本体推理、业务工具链、对话记忆和Gradio界面,通过Stable Baselines3 PPO算法实现从数据到训练再到部署的闭环学习,能自主优化购物助手的决策策略。
NotHumanAllowed是一个多智能体认知数据集生成引擎,通过38个专业AI代理进行多轮审议,产生可审计的推理轨迹和结构化知识记录,用于训练下一代AI系统。
MCP Thought Server是一个为AI代理提供高级思维工具的服务,通过模型上下文协议(MCP)增强推理、规划和迭代优化能力。它包含结构化思维、迭代草稿和集成思维等工具,支持SQLite持久化和高级置信度评分系统,可配置环境变量以适应不同需求。
MCP推理服务器为Claude Desktop提供系统化推理能力,支持束搜索和蒙特卡洛树搜索两种策略,适用于数学、逻辑等复杂问题求解。
本地化运行的智能代理系统,结合推理模型与工具调用模型
Archon是一个自主构建和优化AI代理的智能系统,通过迭代开发展示现代AI的关键原则,包括代理推理、领域知识整合和可扩展架构。当前版本V4提供了全面的Streamlit界面,支持Docker部署,并与MCP服务集成以实现AI IDE的无缝对接。
Atom of Thoughts是一个基于分解-收缩机制的推理框架,通过将复杂问题分解为原子单元进行系统化解决,提供完整版和轻量版两种工具。
Atom of Thoughts是一个基于分解-收缩机制的推理框架,通过将复杂问题分解为原子化思考单元进行系统化验证,提供完整版和轻量版两种工具。
Allora MCP服务器是一个基于Model Context Protocol(MCP)的实现,提供从Allora网络获取机器学习推理数据的功能,使AI系统能够无缝访问Allora预测市场数据。
IntelliGlow是一个基于MCP协议的智能照明系统,通过AI助手控制真实智能灯泡,支持语音命令、AI推理和直接硬件控制,实现自然语言交互和智能灯光管理。
Sensei MCP是一个多角色工程导师系统,集成了64个专业AI角色,通过协作指导提供工程标准和建议。它能在Claude推理前注入相关工程规范,支持多种文件类型和上下文感知,并具备会话记忆和团队协作功能。
Adaptive MCP Server是一个先进的AI推理系统,通过多策略推理、实时研究和综合验证,为复杂问题提供智能解决方案。
提供结构化论证工具,支持系统化辩证推理与论点分析,帮助大语言模型进行复杂问题评估和多视角论证。
一个专注于结构化顺序思维的MCP服务器,提供问题分解、推理链追踪和思维模式存储功能,并与记忆银行系统集成。