Best 推理智能体 AI Tools & Models - Premium 推理智能体 News

AI News

OpenAI发布GPT-5.2-Codex：最强智能体编程模型登场，可自主完成漏洞挖掘与PR提交

OpenAI发布GPT-5.2-Codex，这是其最先进的智能体编程模型。它专为处理复杂、长期的现实编码任务设计，在基准测试中创下新纪录，并能自主完成从代码理解、环境搭建到漏洞挖掘和提交Pull Request的全流程。该模型融合了GPT-5.2的通用推理能力和GPT-5.1-Codex-Max的终端操作功能，标志着AI在软件工程实战能力上的重大突破。

9.8k 28 minutes ago

国产算力“军团”集结：万卡推理引擎+开元模型同日发布

2025光明科学城论坛在深圳举行，聚焦智能算力与大模型智能体。鹏城实验室等机构发布四项重要成果：鹏城脑海2.1开源多模态模型及配套数据集与工具链；国产万卡推理引擎FenixCOS首次亮相，支持大规模并行与高效切换；气象智能体“阿福”接入鹏城云脑Ⅲ，将服务第十五届全国运动会。

10k 2 days ago

阶跃星辰推出全新开源 GUI 智能体 GELab-Zero，助力本地化智能应用

阶跃星辰发布首个开源GUI智能体“GELab-Zero”，包含即插即用推理基础设施和4B GUI Agent模型。其轻量级设计支持消费级硬件本地运行，实现低延迟响应并保护用户隐私，提供高效便捷的智能体体验。

12.7k yesterday

DeepMind发布“Gemini 3 Pro系统指令”：Agent任务成功率提升5%，多步骤工作流可靠性工程化

Google DeepMind发布Gemini 3 Pro专属系统指令，在三大智能体基准测试中平均成功率提升5%，多步骤任务错误率降低8%。新指令强调模型需作为“强推理规划者”，在行动前必须结构化制定计划，推动大模型从黑箱调参转向工程化指令新阶段。

12.4k 3 hours ago

AI Products

PARTNR

多智能体任务规划与推理的基准测试

研究工具

5.8k

SciAgentsDiscovery

自动化科学研究的多智能体图推理系统。

AI学术研究

16.3k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-20250822

Tencent

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

qwen-deep-research

Alibaba

$54

Input tokens/M

$163

Output tokens/M

Context Length

DeepSeek-V3.1

Deepseek

Input tokens/M

$12

Output tokens/M

128

Context Length

百度蒸汽机2.0音视一体

Baidu

Input tokens/M

Output tokens/M

Context Length

qwen-vl-max

Alibaba

$1.6

Input tokens/M

Output tokens/M

128

Context Length

MCP

Minirag Mcp

MiniRAG-MCP是一个MCP服务器包装器，围绕MiniRAG项目构建，旨在通过客户端管理的LLM推理采样，为本地设备上的智能体流程提供高效、可靠的检索增强生成（RAG）服务。

python

6.1k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

OpenAI发布GPT-5.2-Codex：最强智能体编程模型登场，可自主完成漏洞挖掘与PR提交

国产算力“军团”集结：万卡推理引擎+开元模型同日发布

阶跃星辰推出全新开源 GUI 智能体 GELab-Zero，助力本地化智能应用

DeepMind发布“Gemini 3 Pro系统指令”：Agent任务成功率提升5%，多步骤工作流可靠性工程化

AI Products

PARTNR

SciAgentsDiscovery

Models

GPT-4.1 mini

GPT-5 Codex

Claude Haiku 4.5

Claude Sonnet 4.5

Claude 3 Sonnet

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

Kimi-K2

Doubao-1.5-pro-32k

Qianfan-VL-8B

Qianfan-VL-70B

Grok Code Fast 1

Hunyuan-T1-20250822

Hunyuan-T1-latest

qwen-deep-research

DeepSeek-V3.1

百度蒸汽机2.0音视一体

qwen-vl-max

MiroThinker V1.0 30B GGUF

Qwen Samantha 2.0

Rnj 1

MiniMax M2 AWQ 4bit

Qwen3 VL 4B Instruct

Qwen3 VL 30B A3B Instruct 1M GGUF

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking 1M GGUF

Qwen3 VL 32B Instruct 1M GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 4B Thinking 1M GGUF

Qwen3 VL 4B Instruct 1M GGUF

Qwen3 VL 2B Thinking 1M GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 2B Thinking GGUF

Qwen3 VL 8B Thinking GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

MCP

Minirag Mcp