最好的AI推理 AI工具模型_精選AI推理資訊

AI資訊

Paytm 與 Groq 合作，推動高性能 AI 模型發展

印度支付巨頭Paytm與美國硬件公司Groq合作，將利用GroqCloud雲端服務提升AI模型性能，優化交易處理、風險評估、欺詐檢測和消費者互動。GroqCloud基於自主研發的語言處理單元，專注於AI推理，旨在增強Paytm平臺的智能化水平。

5.5k 2 小時前

微軟 Azure ND GB300 再創記錄：每秒推理速度達 110 萬token

微軟Azure ND GB300v6虛擬機在Llama270B模型上創下每秒110萬token推理速度新紀錄。該成就基於與英偉達的深度合作，採用配備72個Blackwell Ultra GPU和36個Grace CPU的NVIDIA GB300NVL72系統，突顯微軟在規模化AI運算領域的專業實力。

9.7k 昨天

微軟 Azure ND GB300 再創記錄：每秒推理速度達 110 萬token

螞蟻數科推出多語種視覺大模型訓練框架，高效識別文檔僞造與邏輯矛盾

螞蟻數科在香港金融科技節推出“多語種多模態大模型訓練框架”，旨在解決大模型在多語言環境的應用瓶頸。傳統英文大模型在小語種中易出現語言錯亂和推理混亂，限制全球化發展。該框架通過優化多語種處理能力，提升模型在多樣化語言環境下的表現，推動AI技術更廣泛高效地服務於全球各行業。

10k 44 分鐘前

美的發佈新一代 Home AI 系統:打造“能思考”的智能家居中樞

在美的“遠見者大會”上，徐翼介紹了新一代AI交互系統Home AI。該系統通過“連接—感知—推理—執行”閉環，實現智能聯動家電設備，並基於用戶習慣自動優化，提升人機交互體驗。

9.9k 10 小時前

AI產品

Nano Banana 2

Google基於Gemini 3 Pro的AI圖像編輯器，推理強，生成編輯能力出色

圖片生成

Luma Ray3AI

全球首個推理AI視頻模型Ray3，可從文本提示創建4K HDR視頻

視頻生成

6.8k

Ray3

全球首個帶推理智能與16位HDR輸出的AI視頻模型，創作高效專業

視頻生成

6.2k

Ray 3

Ray 3 AI將文本轉化為4K HDR視頻，具備智能推理和多種特色功能。

視頻生成

5.2k

模型

DeepSeek R1 0528 (May '25)

deepseek

$3.6

輸入tokens/百萬

$15.48

輸出tokens/百萬

128k

上下文長度

Gemini 2.5 Flash Preview (May '25) (Reasoning)

google

$2.16

輸入tokens/百萬

$18

輸出tokens/百萬

上下文長度

Claude 4 Opus (Extended Thinking)

anthropic

$108

輸入tokens/百萬

$540

輸出tokens/百萬

200k

上下文長度

GLM-4.5

chatglm

$0.43

輸入tokens/百萬

$1.01

輸出tokens/百萬

131.1k

上下文長度

MiniMax M1 80k

minimax

輸入tokens/百萬

輸出tokens/百萬

上下文長度

MiniMax M1 40k

minimax

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Kimi K2

moonshotai

$4.1

輸入tokens/百萬

$16.56

輸出tokens/百萬

128k

上下文長度

Gemini 2.5 Flash

google

$2.16

輸入tokens/百萬

$18

輸出tokens/百萬

上下文長度

Claude 4 Sonnet

anthropic

$21.6

輸入tokens/百萬

$108

輸出tokens/百萬

200k

上下文長度

DeepSeek R1 0528 Qwen3 8B

deepseek

$3.6

輸入tokens/百萬

$15.48

輸出tokens/百萬

128k

上下文長度

Solar Pro 2 (Preview) (Reasoning)

upstage

輸入tokens/百萬

輸出tokens/百萬

64k

上下文長度

Gemini 2.0 Pro Experimental (Feb '25)

google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Reka Flash 3

reka-ai

輸入tokens/百萬

輸出tokens/百萬

128k

上下文長度

Solar Pro 2

upstage

輸入tokens/百萬

輸出tokens/百萬

65.5k

上下文長度

Claude Opus 4.1

anthropic

$108

輸入tokens/百萬

$540

輸出tokens/百萬

200k

上下文長度

Gemini 2.5 Flash-Lite

google

$0.72

輸入tokens/百萬

$2.88

輸出tokens/百萬

上下文長度

GLM-4-Plus

智谱ai

$4.5

輸入tokens/百萬

$22.5

輸出tokens/百萬

128k

上下文長度

Claude 3.5 Sonnet (Oct '24)

anthropic

輸入tokens/百萬

輸出tokens/百萬

200k

上下文長度

Mistral Small 3.2

mistral

$0.5

輸入tokens/百萬

$1.01

輸出tokens/百萬

128k

上下文長度

GPT-4o (May '24)

openai

輸入tokens/百萬

輸出tokens/百萬

128k

上下文長度

MCP

Perplexity Research Assistant

Perplexity MCP Server是一個智能研究助手，利用Perplexity的AI模型自動分析查詢複雜度並選擇最佳模型處理請求，支持搜索、推理和深度研究三種工具。

typescript

13.3k

4.5分

Perplexity Mcp

Perplexity MCP Server是一個智能研究助手，利用Perplexity的AI模型提供自動查詢複雜度檢測和最優模型路由功能，支持搜索、推理和深度研究三種工具。

typescript

6.4k

3.5分

RAT (Retrieval Augmented Thinking)

結合DeepSeek推理與Claude生成的兩階段AI對話服務

typescript

26.1k

3.0分

Think Mcp Server

基於Anthropic研究的MCP服務器，為Claude AI提供'think'工具能力，增強複雜推理任務處理。

typescript

7.5k

2.5分

Mcp Reasoning Server

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。

javascript

10.7k

2.5分

Mcp Server Replicate

一個基於Replicate API的FastMCP服務器實現，專注於提供資源化的AI模型推理訪問，特別擅長圖像生成功能。

python

6.6k

2.5分

Mcp Thought Server

MCP Thought Server是一個為AI代理提供高級思維工具的服務，通過模型上下文協議（MCP）增強推理、規劃和迭代優化能力。它包含結構化思維、迭代草稿和集成思維等工具，支持SQLite持久化和高級置信度評分系統，可配置環境變量以適應不同需求。

typescript

7.8k

2.5分

Mcp Dual Cycle Reasoner

MCP雙循環推理器是一個為自主AI代理設計的元認知增強工具，通過雙循環框架（哨兵監控和裁決器管理）實現異常檢測和經驗學習，提升代理的自我意識和可靠性。

typescript

5.7k

2.5分

Perplexity

Perplexity MCP服務器是一個Go編寫的中間件，為AI助手提供即時搜索和複雜推理能力

6.2k

2.5分

Advanced Reasoning

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法和自動迭代功能。

javascript

6.8k

2.5分

Advanced Reason Mcp

基於Gemini API的高級推理與反思工具，支持多模型集成與自定義配置

typescript

2.5分

Think Mcp

Think MCP是一個實現MCP服務器的項目，提供'think'工具以支持AI代理在複雜任務中進行結構化推理，靈感來自Anthropic的研究。該工具通過記錄思考過程幫助AI處理信息、回溯或遵守策略，適用於工具輸出分析、策略密集環境和順序決策場景。

python

5.1k

2.5分

Mindbridge Mcp

MindBridge是一個AI模型路由服務器，支持多LLM提供商，實現智能模型調度與協作，適用於複雜推理任務和多模型工作流。

typescript

2.5分

Smart Thinking

Smart-Thinking是一個先進的MCP服務器，提供多維、自適應且可自驗證的AI推理框架，採用基於圖形的架構實現複雜思維連接，支持跨平臺運行並與多種MCP客戶端兼容。

typescript

6.1k

2.5分

MCP Think Tool Server

為Claude AI提供結構化思考工具的服務

typescript

5.4k

2.5分

ChatGPT_MCP

該項目是一個基於Model Context Protocol (MCP)的stdio服務器，用於將提示轉發至OpenAI的ChatGPT (GPT-4o)，支持高級摘要、分析和推理功能，適用於LangGraph框架的助手集成。

python

10k

2.5分

Smart Thinking

Smart-Thinking是一個先進的MCP服務器，提供多維、自適應且可自我驗證的AI推理框架。

typescript

6.9k

2.5分

Adaptive Graph Of Thoughts Mcp Server

Adaptive Graph of Thoughts是一個基於Neo4j圖數據庫的智能科學推理框架，通過圖結構實現複雜的科學推理任務，支持與Claude Desktop等AI應用集成。

python

4.9k

2.5分

Deep Reasoning (OpenRouter)

基於MCP協議的深度推理服務器，為客戶端提供AI深度推理服務

typescript

4.8k

2.5分

Mcp Servers Pmo

Archon是一個自主構建和優化AI代理的智能系統，通過迭代開發展示現代AI的關鍵原則，包括代理推理、領域知識整合和可擴展架構。當前版本V4提供了全面的Streamlit界面，支持Docker部署，並與MCP服務集成以實現AI IDE的無縫對接。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

Paytm 與 Groq 合作，推動高性能 AI 模型發展

微軟 Azure ND GB300 再創記錄：每秒推理速度達 110 萬token

螞蟻數科推出多語種視覺大模型訓練框架，高效識別文檔僞造與邏輯矛盾

美的發佈新一代 Home AI 系統:打造“能思考”的智能家居中樞

AI產品

Nano Banana 2

Luma Ray3AI

Ray3

Ray 3

模型

DeepSeek R1 0528 (May '25)

Gemini 2.5 Flash Preview (May '25) (Reasoning)

Claude 4 Opus (Extended Thinking)

GLM-4.5

MiniMax M1 80k

MiniMax M1 40k

Kimi K2

Gemini 2.5 Flash

Claude 4 Sonnet

DeepSeek R1 0528 Qwen3 8B

Solar Pro 2 (Preview) (Reasoning)

Gemini 2.0 Pro Experimental (Feb '25)

Reka Flash 3

Solar Pro 2

Claude Opus 4.1

Gemini 2.5 Flash-Lite

GLM-4-Plus

Claude 3.5 Sonnet (Oct '24)

Mistral Small 3.2

GPT-4o (May '24)

Qwen3 VL 2B Instruct GGUF

Thewhisper Large V3 Turbo

Thewhisper Large V3

Pokee_research_7b GGUF

LFM2 VL 3B

Pokee_research_7b

GLM 4.6 AWQ

GLM 4.6

GLM 4.6 GGUF

GLM 4.6

GLM 4.6 FP8

Qwen3 0.6B

Qwen3 32B FP4

Qwen3 14B FP4

Kimi K2 Instruct 0905 HQ4_K

Llama 3.1 8b Roleplay Airtel Gguf

Glm 0.5B Old

Luth LFM2 700M

Luth LFM2 350M

GLM 4.5 Air 3bit DWQ V2

MCP

Perplexity Research Assistant

Perplexity Mcp

RAT (Retrieval Augmented Thinking)

Think Mcp Server

Mcp Reasoning Server

Mcp Server Replicate

Mcp Thought Server

Mcp Dual Cycle Reasoner

Perplexity

Advanced Reasoning

Advanced Reason Mcp

Think Mcp

Mindbridge Mcp

Smart Thinking

MCP Think Tool Server

ChatGPT_MCP

Smart Thinking

Adaptive Graph Of Thoughts Mcp Server

Deep Reasoning (OpenRouter)

Mcp Servers Pmo