最好的推理能力 AI工具模型_精選推理能力資訊

AI資訊

從Agent到DeepSeek:英偉達CEO談AI模型的三大里程碑突破

英偉達CEO黃仁勳在達沃斯論壇上表示，過去一年AI模型層取得三大突破：一是代理式AI的崛起，模型具備複雜推理與計劃能力；二是開源模型生態繁榮，如DeepSeek等降低了技術門檻；三是多模態AI的快速發展，推動AI應用更廣泛落地。

Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式

Liquid AI推出LFM2.5-1.2B-Thinking推理模型，擁有12億參數，專爲複雜邏輯推理和數學任務設計。該模型在端側部署上實現突破，僅佔用約900MB內存，可在現代手機上完全離線運行，將兩年前需數據中心支持的推理能力成功遷移至個人移動設備。

13.1k 25 分鐘前

Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式

30B規格新標杆!智譜AI開源GLM-4.7-Flash，多項測試力壓阿里OpenAI

智譜AI開源最新“混合思考”模型GLM-4.4-Flash，採用30B-A3B MoE架構，總參數量300億，實際激活約30億參數。該模型在保持輕量化部署優勢的同時，憑藉卓越推理與編碼能力，登頂同類規格模型性能榜首，成爲30B級別中的“全能王者”。

13.2k 1 小時前

30B規格新標杆!智譜AI開源GLM-4.7-Flash，多項測試力壓阿里OpenAI

美團推出 LongCat-Flash-Thinking-2601，開源工具調用能力再登高峯

美團LongCat團隊開源了最新AI模型LongCat-Flash-Thinking-2601，該模型在智能體搜索、工具調用及推理等多項核心評測中達到開源模型最高水平。其核心優勢在於卓越的工具調用能力，能有效處理依賴工具的複雜任務，顯著降低真實場景中對新工具的適應成本。

12.5k 17 小時前

美團推出 LongCat-Flash-Thinking-2601，開源工具調用能力再登高峯

AI產品

Gemini 3 Pro

Google DeepMind旗艦多模態AI，1M上下文，具備博士級推理與高級編碼能力

AI模型

5.9k

Nano Banana 2

Google基於Gemini 3 Pro的AI圖像編輯器，推理強，生成編輯能力出色

圖片生成

6.1k

gpt oss

開放AI的GPT-OSS-120B和GPT-OSS-20B提供強大的推理能力，開發人員友好的功能，並採用Apache 2.0許可證，實現人工智能的民主化訪問。

AI模型

6.1k

Gpt 5 Ai

GPT 5是下一代AI模型，提供卓越的編碼、數學和推理性能。

AI模型

8.1k

模型

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

wan2.5-i2v-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-omni-flash-realtime

Alibaba

$3.9

輸入tokens/百萬

$15.2

輸出tokens/百萬

上下文長度

Doubao-Seed-1.6

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

MCP

MCP Reasoner

MCP推理器是為Claude Desktop設計的增強推理能力的工具，提供波束搜索和蒙特卡洛樹搜索兩種算法，並新增實驗性策略模擬層以優化複雜問題解決。

javascript

3.5分

Mcp Reasoner

MCP Reasoner是為Claude Desktop設計的推理增強工具，提供Beam Search和MCTS兩種搜索策略，通過實驗性算法提升複雜問題解決能力。

javascript

9.8k

3.5分

Think Mcp Server

基於Anthropic研究的MCP服務器，為Claude AI提供'think'工具能力，增強複雜推理任務處理。

typescript

8.2k

2.5分

Deepseek Claude MCP Server

通過集成DeepSeek R1的推理引擎增強Claude的複雜任務處理能力

python

6.9k

2.5分

Mcp Agent Tool Adapter

MCP代理工具適配器項目通過MCP協議實現模塊化工具調用，支持Google ADK和LangGraph兩種代理框架，提供動態推理和工具規劃能力。

python

7.6k

2.5分

Mcp Reasoning Server

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。

javascript

10.6k

2.5分

Mcp Thought Server

MCP Thought Server是一個為AI代理提供高級思維工具的服務，通過模型上下文協議（MCP）增強推理、規劃和迭代優化能力。它包含結構化思維、迭代草稿和集成思維等工具，支持SQLite持久化和高級置信度評分系統，可配置環境變量以適應不同需求。

typescript

8.7k

2.5分

Perplexity

Perplexity MCP服務器是一個Go編寫的中間件，為AI助手提供即時搜索和複雜推理能力

9.6k

2.5分

Advanced Reasoning

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法和自動迭代功能。

javascript

8.5k

2.5分

Ollama MCP Bridge WebUI

一個連接本地LLM與MCP服務器的TypeScript橋樑項目，提供Web界面使開源模型能使用類似Claude的工具能力，支持文件系統、網絡搜索和複雜推理等功能。

typescript

9.7k

2.5分

DeepSeek Reasoner

該項目通過集成DeepSeek R1的推理引擎增強Claude的複雜任務處理能力，提供多步驟精確推理支持。

python

5.5k

2.5分

Thoughtful Claude

Thoughtful Claude是一個增強Claude推理能力的MCP服務器，通過集成DeepSeek R1的高級推理引擎，為Claude提供複雜多步推理任務處理能力。

python

5.9k

2.5分

MCP Reasoner

MCP推理服務器為Claude Desktop提供系統化推理能力，支持束搜索和蒙特卡洛樹搜索兩種策略，適用於數學、邏輯等複雜問題求解。

javascript

7.7k

2.5分

Mindmesh Mcp Server

一個基於量子場計算模型的Claude多實例協同推理服務器，通過場一致性優化實現增強型AI推理能力。

typescript

5.6k

2.5分

Retrieval Augmented Thinking

一個增強AI模型推理能力的MCP服務器，通過結構化檢索和動態思維鏈提升問題解決能力。

typescript

2.5分

Perplexity Mcp Server N01

Perplexity MCP Server是一個用Go編寫的中間件服務器，為AI助手（如Claude和Cursor）提供無縫訪問Perplexity API的能力，包括即時搜索和複雜推理功能。

9.3k

2.5分

DeepSeek + Claude

結合DeepSeek推理與Claude生成能力的MCP服務

typescript

7.7k

2.5分

Think Mcp Server

官方實現的Anthropic'思考'工具MCP服務器，通過結構化思考顯著提升Claude的推理能力

typescript

5.4k

2.5分

Mcp Server Logical Solver

MCP邏輯求解器是一個結合大型語言模型與形式化定理證明能力的強大推理系統，支持自然語言和一階邏輯輸入，通過Prover9/Mace4進行自動驗證，並提供結構化推理和解釋。

python

2.5分

Chain of Draft Prompt Tool

MCP Chain of Draft Prompt Tool是一個增強LLM推理能力的工具，通過將標準提示轉換為Chain of Draft或Chain of Thought格式，顯著提高推理質量並減少token使用。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

從Agent到DeepSeek:英偉達CEO談AI模型的三大里程碑突破

​Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式

30B規格新標杆!智譜AI開源GLM-4.7-Flash，多項測試力壓阿里OpenAI

美團推出 LongCat-Flash-Thinking-2601，開源工具調用能力再登高峯

AI產品

Gemini 3 Pro

Nano Banana 2

gpt oss

Gpt 5 Ai

模型

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-vl-plus

qwen3-max

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qianfan-Lightning

Qwen3-Next-80B-A3B-Instruct

wan2.5-i2v-preview

qwen3-omni-flash-realtime

Doubao-Seed-1.6

Kimi-K2

GLM 4.5 Air Derestricted Qx53g Mlx

Hypnos I1 8B

Qwen3 4B Thinking 2507 GGUF

Nanbeige4 3B Thinking 2511

Olmo 3 32B Think

Chronoedit

MiroThinker V1.0 30B MXFP4_MOE GGUF

OpenMMReasoner ColdStart

MiMo Embodied 7B

MiroThinker V1.0 30B GGUF

Gemma2 Maria Gguf

Olmo 3 7B Think DPO

Olmo 3 7B Think

Olmo 3 7B Instruct SFT

Olmo 3 7B RL Zero Math

Olmo 3 7B RL Zero Mix

Qwen Samantha 2.0

Wan2.2 TI2V 5B Turbo GGUF

Qwen3 30B A3B Thinking 2507 Claude 4.5 Sonnet High Reasoning Distill

Olmo 3 32B Think DPO

MCP

MCP Reasoner

Mcp Reasoner

Think Mcp Server

Deepseek Claude MCP Server

Mcp Agent Tool Adapter

Mcp Reasoning Server

Mcp Thought Server

Perplexity

Advanced Reasoning

Ollama MCP Bridge WebUI

DeepSeek Reasoner

Thoughtful Claude

MCP Reasoner

Mindmesh Mcp Server

Retrieval Augmented Thinking

Perplexity Mcp Server N01

DeepSeek + Claude

Think Mcp Server

Mcp Server Logical Solver

Chain of Draft Prompt Tool

Liquid AI 發佈 1.2B 推理模型：不到 1GB 內存，手機端側即可運行“思考”模式