最好的推理API AI工具模型_精選推理API資訊

AI資訊

小米MiMo登頂OpenRouter全球調用量榜首，國產大模型首次問鼎

小米MiMo在全球最大AI模型API聚合平臺OpenRouter上登頂全球調用量榜首，成爲首個獲此成就的國產大模型。近一個月，MiMo貢獻1.45萬億Token調用量，在300多個模型中脫穎而出。其端雲協同架構設計帶來高推理效率和低成本，實用性優先的定位獲全球開發者認可。生態上，Nous Research已與小米合作，MiMo系列全面接入增長最快的開源生態。

13.9k 5 小時前

谷歌發佈 Gemini API 新定價策略，推理服務按需計費

谷歌更新Gemini API計費結構，新增標準、彈性、優先、批量和緩存版服務檔位，滿足不同推理需求。彈性檔位利用非高峯閒置算力，提供更靈活選擇。

18.9k 3 天前

AI 編程進入“靠譜”時代：通義實驗室正式發佈 Qwen3.6-Plus

通義實驗室發佈Qwen3.6-Plus模型，聚焦解決智能體編程中“任務執行不穩”問題。該模型通過阿里雲百鍊API開放調用，核心升級在於融合深度邏輯推理、海量記憶與精準執行，顯著提升編碼能力，尤其在前端頁面生成、代碼修復及終端自動化場景表現卓越。

28.7k 昨天

OpenAI 發佈 GPT-5.4系列:百萬級上下文窗口，Pro 與 Thinking 版同步登場

OpenAI發佈GPT-5.4系列模型，包括標準版、專注複雜邏輯的推理版GPT-5.4Thinking及高性能優化版GPT-5.4Pro。其API版本支持100萬個標記的上下文窗口，爲OpenAI史上最大，顯著提升了處理能力和效率。

14k 7 小時前

OpenAI 發佈 GPT-5.4系列:百萬級上下文窗口，Pro 與 Thinking 版同步登場

AI產品

Atlas Cloud

全球首個全模態推理平臺，統一API接入300+模型，OpenAI兼容

開發平臺

8.9k

SiliconFlow

為開發者提供快速的AI平臺，部署、優化和運行200多個LLM和多模型。

模型訓練與部署

10.1k

DeepClaude

結合DeepSeek R1推理能力和Claude創造力及代碼生成能力的統一API和聊天界面。

開發與工具

13.2k

Exa & Deepseek Chat App

一個開源的聊天應用，使用Exa的API進行網絡搜索，結合Deepseek R1進行推理。

聊天機器人

10.7k

模型

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

Doubao-1.5-pro-32k

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

MCP

Search_intent

這是一個基於MCP協議的搜索意圖分析服務，通過API分析用戶搜索關鍵詞的意圖，提供分類、推理過程和相關建議，主要用於SEO分析。

typescript

10.1k

2.5分

Mcp Server Replicate

一個基於Replicate API的FastMCP服務器實現，專注於提供資源化的AI模型推理訪問，特別擅長圖像生成功能。

python

8.4k

2.5分

Advanced Reason Mcp

基於Gemini API的高級推理與反思工具，支持多模型集成與自定義配置

typescript

7.1k

2.5分

Rlm

RLM MCP服務器是一個基於遞歸語言模型模式的大規模上下文處理工具，允許Claude代碼通過外部變量處理超過1000萬token的文本，避免直接將海量內容輸入提示詞。它通過加載、分塊、子查詢和聚合的流程，支持自動分析和程序化執行，可連接Claude API或本地Ollama進行免費推理。

python

4.5k

2.5分

Search Intent AI

搜索意圖分析服務，通過API分析關鍵詞意圖，提供分類、推理及SEO支持

typescript

9.9k

2.5分

Perplexity Mcp Server Gfh

一個基於TypeScript的MCP服務器，提供與Perplexity AI API交互的工具，支持搜索增強查詢和內部推理過程展示。

typescript

9.7k

2.5分

Perplexity Mcp Server N01

Perplexity MCP Server是一個用Go編寫的中間件服務器，為AI助手（如Claude和Cursor）提供無縫訪問Perplexity API的能力，包括即時搜索和複雜推理功能。

10.6k

2.5分

Deepseek Thinker Mcp

Deepseek Thinker MCP Server是一個提供Deepseek推理內容的MCP服務，支持OpenAI API和本地Ollama兩種模式，可集成到AI客戶端中。

typescript

2.5分

Clarifai Mcp Server Local

該項目是一個非官方的Clarifai MCP服務器，作為本地橋樑連接Clarifai API，支持圖像生成、推理和搜索等功能，通過標準MCP協議與客戶端交互。

6.2k

2.5分

Advanced Reasoning with DeepSeek

基於Gemini API的高級推理與反思工具

typescript

9.3k

2.5分

MCP Server Using Gemini

該項目是一個基於Gemini Flash 1.5 API的MCP服務器實現，通過中央路由器協調多個模塊化AI服務（如聊天、搜索、RAG、深度推理等），實現智能化的請求分發和響應處理。

javascript

9.6k

2.0分

Gemini Mcp Server Chatbot

一個基於Gemini Flash 1.5 API的MCP服務器實現，通過中央路由器協調多個模塊化AI服務（聊天、搜索、RAG、深度推理等），實現智能化的請求分發和響應整合。

javascript

7.9k

2.0分

Ai00 Rwkv Server

AI00 RWKV Server是一個基於RWKV語言模型的高效推理API服務器，支持Vulkan加速和OpenAI兼容接口。

rust

10.2k

2.0分

X402engine Mcp

x402engine-mcp是一個為AI代理提供HTTP 402微支付訪問38個按次付費API的MCP服務器，支持使用USDC和USDm進行支付，涵蓋LLM推理、圖像生成、代碼執行、音頻處理、區塊鏈數據等多種服務。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

小米MiMo登頂OpenRouter全球調用量榜首，國產大模型首次問鼎

​谷歌發佈 Gemini API 新定價策略，推理服務按需計費

AI 編程進入“靠譜”時代：通義實驗室正式發佈 Qwen3.6-Plus

OpenAI 發佈 GPT-5.4系列:百萬級上下文窗口，Pro 與 Thinking 版同步登場

AI產品

Atlas Cloud

SiliconFlow

DeepClaude

Exa & Deepseek Chat App

模型

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-vl-plus

qwen-image-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qianfan-Lightning

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

Qwen2.5 0.5B Instruct

DeepSeek R1 Distill Qwen 1.5B

Octopus V2

Sdvn5 3dcutewave

MCP

Search_intent

Mcp Server Replicate

Advanced Reason Mcp

Rlm

Search Intent AI

Perplexity Mcp Server Gfh

Perplexity Mcp Server N01

Deepseek Thinker Mcp

Clarifai Mcp Server Local

Advanced Reasoning with DeepSeek

MCP Server Using Gemini

Gemini Mcp Server Chatbot

Ai00 Rwkv Server

X402engine Mcp

谷歌發佈 Gemini API 新定價策略，推理服務按需計費