Best AI推理 AI Tools & Models - Premium AI推理 News

AI News

谷歌密造"Frozen v2"专用芯片：把Gemini烙进硅片，单位功耗token能力翻 6 到 10 倍

谷歌正研发代号Frozen v2的AI芯片，将Gemini模型的架构直接固化在硅片中，以省去部分算力与数据搬运，提升推理效率。与最新通用TPU相比，该芯片有望实现更高的能效比，更经济地运行大模型。

6.7k 6 minutes ago

文远知行发布物理AI认知基础大模型WIIT，构建真实世界理解框架

文远知行在2026世界人工智能大会发布WIIT大模型，提出“最小物理事实单元”理念，将连续环境拆解为基础事实，构建物理世界AI理解框架，包含事实提取、推理、验证等模块，推动AI从数据理解迈向真实世界认知。

15.1k 36 minutes ago

智谱数亿元收购中科加禾，补强AI Infra与国产算力适配能力

智谱斥资数亿元收购AI Infra公司中科加禾，强化国产算力适配与推理优化。中科加禾源自中科院计算所，专注编译技术，团队曾参与龙芯、华为昇腾等国产芯片编译器开发，具备从虚拟指令集到优化部署的全链路能力，补足模型底层工程短板。

15.7k 22 minutes ago

高德发布通用世界模型工坊ABot-World Studio 支持实时交互的AI数字世界

高德发布ABot-World Studio，融合交互式视频生成与3D场景构建，用户输入文字或图片即可一键生成高保真、可实时交互的AI数字世界。其技术突破在于支持单张5090显卡本地部署，并打破以往世界模型推理时长限制，实现更低门槛高效创作。

13.2k 1 hours ago

高德发布通用世界模型工坊ABot-World Studio 支持实时交互的AI数字世界

AI Products

Auriko

Auriko是LLM推理的AI控制平面，集成网关、路由、监控和FinOps功能。

开发平台

5.3k

RunInfra

RunInfra优化开源模型用于生产，提供可导出的部署堆栈和API。

模型训练与部署

5.6k

Baseten

最快、最可靠的推理平台，可部署和扩展开源及自定义AI模型

模型训练与部署

Oxlo.ai

Oxlo.ai提供前沿AI模型推理API，定价灵活，保护隐私。

API服务

4.1k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

MCP

Perplexity Research Assistant

Perplexity MCP Server是一个智能研究助手，利用Perplexity的AI模型自动分析查询复杂度并选择最佳模型处理请求，支持搜索、推理和深度研究三种工具。

typescript

25.2k

4.5points

Perplexity Mcp

Perplexity MCP Server是一个智能研究助手，利用Perplexity的AI模型提供自动查询复杂度检测和最优模型路由功能，支持搜索、推理和深度研究三种工具。

typescript

14.4k

3.5points

RAT (Retrieval Augmented Thinking)

结合DeepSeek推理与Claude生成的两阶段AI对话服务

typescript

29.8k

3.0points

Mindmesh Mcp Server

一个基于量子场计算模型的Claude多实例协同推理服务器，通过场一致性优化实现增强型AI推理能力。

typescript

2.5points

Perplexity Mcp Server N01

Perplexity MCP Server是一个用Go编写的中间件服务器，为AI助手（如Claude和Cursor）提供无缝访问Perplexity API的能力，包括实时搜索和复杂推理功能。

11.1k

2.5points

Think Mcp

Think MCP是一个实现MCP服务器的项目，提供'think'工具以支持AI代理在复杂任务中进行结构化推理，灵感来自Anthropic的研究。该工具通过记录思考过程帮助AI处理信息、回溯或遵守策略，适用于工具输出分析、策略密集环境和顺序决策场景。

python

11.3k

2.5points

Forge Mcp Server

Forge MCP服务器是一个通过32个并行AI代理将PyTorch模型自动优化为高性能CUDA/Triton内核的工具，可将推理速度提升高达14倍，支持多种MCP兼容的AI编程助手。

typescript

8.7k

2.5points

GemForge (Google Gemini)

Verified

GemForge是将Google的Gemini AI与MCP生态系统连接的企业级工具，提供实时网络访问、高级推理、代码分析和多文件处理等功能，支持60多种文件格式，具备智能模型选择和强大的错误处理机制。

typescript

8.9k

2.5points

Thoughtbox

Thoughtbox是一个AI思维辅助工具，通过分步思考、修订和分支推理等功能，帮助用户分解复杂问题并优化解决方案

typescript

11.5k

2.5points

Smart Thinking

Smart-Thinking是一个先进的MCP服务器，提供多维、自适应且可自验证的AI推理框架，采用基于图形的架构实现复杂思维连接，支持跨平台运行并与多种MCP客户端兼容。

typescript

9.1k

2.5points

Deepseek Reasoner

一个由Claude构建的DeepSeek推理服务项目

python

28.2k

2.5points

Retrieval Augmented Thinking

一个增强AI模型推理能力的MCP服务器，通过结构化检索和动态思维链提升问题解决能力。

typescript

10.4k

2.5points

Omni Nli

Omni-NLI是一个可自托管的多接口（REST和MCP）服务器，专注于自然语言推理任务，用于验证文本间的支持、矛盾或中立关系，可帮助减少AI幻觉并提升应用可靠性。

python

6.4k

2.5points

Nothumanallowed

NotHumanAllowed是一个多智能体认知数据集生成引擎，通过38个专业AI代理进行多轮审议，产生可审计的推理轨迹和结构化知识记录，用于训练下一代AI系统。

开发者工具

7.8k

2.5points

ChatGPT_MCP

该项目是一个基于Model Context Protocol (MCP)的stdio服务器，用于将提示转发至OpenAI的ChatGPT (GPT-4o)，支持高级摘要、分析和推理功能，适用于LangGraph框架的助手集成。

python

40.4k

2.5points

Mcp Reasoning Server

一个为Cursor AI中的Claude提供高级推理能力的MCP服务器，包含多种推理方法如蒙特卡洛树搜索、束搜索和Transformer混合推理等。

javascript

32.2k

2.5points

Think Mcp Server

基于Anthropic研究的MCP服务器，为Claude AI提供'think'工具能力，增强复杂推理任务处理。

typescript

10.5k

2.5points

Deepseek Thinker Mcp

Deepseek Thinker MCP Server是一个提供Deepseek推理内容的MCP服务，支持OpenAI API和本地Ollama两种模式，可集成到AI客户端中。

typescript

11.2k

2.5points

GemForge MCP

GemForge是将谷歌Gemini AI与MCP生态系统连接的企业级工具，提供实时网络访问、高级推理、代码分析和多文件处理等功能，支持60多种文件格式，具备智能模型选择和强大的错误处理机制。

typescript

9.8k

2.5points

Advanced Reason Mcp

基于Gemini API的高级推理与反思工具，支持多模型集成与自定义配置

typescript

10.4k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

谷歌密造"Frozen v2"专用芯片：把Gemini烙进硅片，单位功耗token能力翻 6 到 10 倍

文远知行发布物理AI认知基础大模型WIIT，构建真实世界理解框架

智谱数亿元收购中科加禾，补强AI Infra与国产算力适配能力

高德发布通用世界模型工坊ABot-World Studio 支持实时交互的AI数字世界

AI Products

Auriko

RunInfra

Baseten

Oxlo.ai

Models

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen-image-edit

Doubao-Seed-Translation

Mistralai_Mistral Large 3 675B Instruct 2512 GGUF

Olmo 3 7B Instruct

Olmo 3 32B Think

MiMo Embodied 7B

Olmo 3 7B Instruct DPO

Olmo 3 7B Think DPO

Olmo 3 7B Think

Olmo 3 7B Instruct SFT

Olmo 3 7B RL Zero Math

Olmo 3 7B RL Zero IF

Olmo 3 7B RL Zero Mix

Olmo 3 32B Think DPO

Rnj 1

Kimi K2 Thinking

Qwen3 VL 2B Instruct GGUF

Thewhisper Large V3 Turbo

Thewhisper Large V3

Pokee_research_7b GGUF

LFM2 VL 3B

Pokee_research_7b

MCP

Perplexity Research Assistant

Perplexity Mcp

RAT (Retrieval Augmented Thinking)

Mindmesh Mcp Server

Perplexity Mcp Server N01

Think Mcp

Forge Mcp Server

GemForge (Google Gemini)

Thoughtbox

Smart Thinking

Deepseek Reasoner

Retrieval Augmented Thinking

Omni Nli

Nothumanallowed

ChatGPT_MCP

Mcp Reasoning Server

Think Mcp Server

Deepseek Thinker Mcp

GemForge MCP

Advanced Reason Mcp