最好的推理AI AI工具模型_精選推理AI資訊

AI資訊

字節跳動自研芯片曝光：10 萬顆量產在即，試圖打破英偉達依賴症

字節跳動正加速自研AI芯片“SeedChip”，計劃今年量產至少10萬顆，主要面向推理任務，以保障AI算力供應。儘管公司稱相關報道“不準確”，但其今年AI採購預算已超1600億元，半數仍用於購買英偉達芯片，反映出在推進大模型時面臨的高推理成本壓力。

10.4k 5 分鐘前

算力能效比直逼 Rubin5倍?初創公司 Positron 發佈 Asimov 架構重塑 AI 推理

Positron發佈AI推理芯片Asimov，宣稱其能效比和性價比預計達英偉達下一代產品的5倍，引發行業關注。該芯片針對大模型推理優化，通過簡化GPU架構提升效率。

10.5k 2 小時前

上海 AI 實驗室發佈科學多模態模型書生Intern-S1-Pro

上海AI實驗室發佈全球最大開源科學多模態模型“書生 Intern-S1-Pro”，參數達1萬億。該模型基於“通專融合”架構SAGE，在科學能力上達到國際領先水平，尤其在複雜學科評測中展現出卓越的邏輯推理能力。

9.6k 5 小時前

DeepMind 開設 AI “線下桌遊局”:Gemini3家族橫掃撲克與狼人殺排行榜

谷歌DeepMind聯合Kaggle升級Game Arena平臺，新增“狼人殺”和“撲克”兩款遊戲，推動AI測試從邏輯運算轉向社交推理與不確定決策，以更全面評估模型性能。

10.6k 4 小時前

DeepMind 開設 AI “線下桌遊局”:Gemini3家族橫掃撲克與狼人殺排行榜

AI產品

Flux2 Klein

Black Forest Labs推出，亞秒級推理、統一編輯、照片級畫質AI圖像生成器。

圖片生成

5.4k

BananaPro

Nano Banana Pro是前沿AI圖像生成引擎，4K畫質、角色一致，推理生成強大。

圖片生成

7.2k

Gemini 3 Pro

Google DeepMind旗艦多模態AI，1M上下文，具備博士級推理與高級編碼能力

AI模型

6.2k

Nano Banana 2

Google基於Gemini 3 Pro的AI圖像編輯器，推理強，生成編輯能力出色

圖片生成

6.2k

模型

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

qwen3-omni-flash-realtime

Alibaba

$3.9

輸入tokens/百萬

$15.2

輸出tokens/百萬

上下文長度

qwen3-tts-flash-realtime

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

Doubao-Seed-1.6

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

MCP

Perplexity Research Assistant

Perplexity MCP Server是一個智能研究助手，利用Perplexity的AI模型自動分析查詢複雜度並選擇最佳模型處理請求，支持搜索、推理和深度研究三種工具。

typescript

16.6k

4.5分

Perplexity Mcp

Perplexity MCP Server是一個智能研究助手，利用Perplexity的AI模型提供自動查詢複雜度檢測和最優模型路由功能，支持搜索、推理和深度研究三種工具。

typescript

10.8k

3.5分

RAT (Retrieval Augmented Thinking)

結合DeepSeek推理與Claude生成的兩階段AI對話服務

typescript

26.2k

3.0分

Think Mcp Server

基於Anthropic研究的MCP服務器，為Claude AI提供'think'工具能力，增強複雜推理任務處理。

typescript

8.3k

2.5分

Mcp Dual Cycle Reasoner

MCP雙循環推理器是一個為自主AI代理設計的元認知增強工具，通過雙循環框架（哨兵監控和裁決器管理）實現異常檢測和經驗學習，提升代理的自我意識和可靠性。

typescript

6.5k

2.5分

Mcp Thought Server

MCP Thought Server是一個為AI代理提供高級思維工具的服務，通過模型上下文協議（MCP）增強推理、規劃和迭代優化能力。它包含結構化思維、迭代草稿和集成思維等工具，支持SQLite持久化和高級置信度評分系統，可配置環境變量以適應不同需求。

typescript

8.7k

2.5分

Mcp Reasoning Server

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。

javascript

10.9k

2.5分

Mcp Server Replicate

一個基於Replicate API的FastMCP服務器實現，專注於提供資源化的AI模型推理訪問，特別擅長圖像生成功能。

python

6.4k

2.5分

Thoughtbox

Thoughtbox是一個AI思維輔助工具，通過分步思考、修訂和分支推理等功能，幫助用戶分解複雜問題並優化解決方案

typescript

10.4k

2.5分

Advanced Reasoning

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法和自動迭代功能。

javascript

8.6k

2.5分

Perplexity

Perplexity MCP服務器是一個Go編寫的中間件，為AI助手提供即時搜索和複雜推理能力

2.5分

Think Mcp

Think MCP是一個實現MCP服務器的項目，提供'think'工具以支持AI代理在複雜任務中進行結構化推理，靈感來自Anthropic的研究。該工具通過記錄思考過程幫助AI處理信息、回溯或遵守策略，適用於工具輸出分析、策略密集環境和順序決策場景。

python

7.4k

2.5分

Mindbridge Mcp

MindBridge是一個AI模型路由服務器，支持多LLM提供商，實現智能模型調度與協作，適用於複雜推理任務和多模型工作流。

typescript

8.6k

2.5分

Smart Thinking

Smart-Thinking是一個先進的MCP服務器，提供多維、自適應且可自驗證的AI推理框架，採用基於圖形的架構實現複雜思維連接，支持跨平臺運行並與多種MCP客戶端兼容。

typescript

2.5分

Smart Thinking

Smart-Thinking是一個先進的MCP服務器，提供多維、自適應且可自我驗證的AI推理框架。

typescript

9.1k

2.5分

Adaptive Graph Of Thoughts Mcp Server

Adaptive Graph of Thoughts是一個基於Neo4j圖數據庫的智能科學推理框架，通過圖結構實現複雜的科學推理任務，支持與Claude Desktop等AI應用集成。

python

5.6k

2.5分

Deep Reasoning (OpenRouter)

基於MCP協議的深度推理服務器，為客戶端提供AI深度推理服務

typescript

6.9k

2.5分

Perplexity Mcp Server Gfh

一個基於TypeScript的MCP服務器，提供與Perplexity AI API交互的工具，支持搜索增強查詢和內部推理過程展示。

typescript

7.2k

2.5分

Mcp Servers Pmo

Archon是一個自主構建和優化AI代理的智能系統，通過迭代開發展示現代AI的關鍵原則，包括代理推理、領域知識整合和可擴展架構。當前版本V4提供了全面的Streamlit界面，支持Docker部署，並與MCP服務集成以實現AI IDE的無縫對接。

python

6.6k

2.5分

GemForge (Google Gemini)

已認證

GemForge是將Google的Gemini AI與MCP生態系統連接的企業級工具，提供即時網絡訪問、高級推理、代碼分析和多文件處理等功能，支持60多種文件格式，具備智能模型選擇和強大的錯誤處理機制。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

字節跳動自研芯片曝光：10 萬顆量產在即，試圖打破英偉達依賴症

​算力能效比直逼 Rubin5倍?初創公司 Positron 發佈 Asimov 架構重塑 AI 推理

上海 AI 實驗室發佈科學多模態模型書生Intern-S1-Pro

DeepMind 開設 AI “線下桌遊局”:Gemini3家族橫掃撲克與狼人殺排行榜

AI產品

Flux2 Klein

BananaPro

Gemini 3 Pro

Nano Banana 2

模型

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Gemini 2.5 Flash-Lite

qwen3-vl-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

qwen3-omni-flash-realtime

qwen3-tts-flash-realtime

Kimi-K2

Doubao-Seed-1.6

Olmo 3 7B Instruct

Olmo 3 32B Think

MiMo Embodied 7B

Olmo 3 7B Instruct DPO

Olmo 3 7B Think DPO

Olmo 3 7B Think

Olmo 3 7B Instruct SFT

Olmo 3 7B RL Zero IF

Olmo 3 7B RL Zero Math

Olmo 3 7B RL Zero Mix

Olmo 3 32B Think DPO

Kimi K2 Thinking

Qwen3 VL 2B Instruct GGUF

Thewhisper Large V3 Turbo

Thewhisper Large V3

Pokee_research_7b GGUF

LFM2 VL 3B

Pokee_research_7b

Olmo 3 7B Think SFT

GLM 4.6 AWQ

MCP

Perplexity Research Assistant

Perplexity Mcp

RAT (Retrieval Augmented Thinking)

Think Mcp Server

Mcp Dual Cycle Reasoner

Mcp Thought Server

Mcp Reasoning Server

Mcp Server Replicate

Thoughtbox

Advanced Reasoning

Perplexity

Think Mcp

Mindbridge Mcp

Smart Thinking

Smart Thinking

Adaptive Graph Of Thoughts Mcp Server

Deep Reasoning (OpenRouter)

Perplexity Mcp Server Gfh

Mcp Servers Pmo

GemForge (Google Gemini)

算力能效比直逼 Rubin5倍?初創公司 Positron 發佈 Asimov 架構重塑 AI 推理