最好的本地推理 AI工具模型_精選本地推理資訊

AI資訊

不做AI產品做AI增強：Ubuntu官宣 2026 年全面集成原生AI

Canonical宣佈Ubuntu 26.04 LTS將重點集成AI功能，旨在打造情境感知的智能操作系統。工程副總裁Jon Seager表示，Ubuntu不會轉型爲純AI產品，而是通過本地推理和智能工作流等技術，增強現有桌面與服務器系統的能力，實現更強大的用戶體驗。

12.9k 40 分鐘前

本地推理“超進化”！Claude Code 對接魔改版 Gemma 4：速度暴增 5 倍，CRUD 開發利器

JeecgBoot在Mac Studio M4Max上實測Claude Code對接本地大模型，發現社區魔改蒸餾版模型比官方原版快5-6倍。測試強調選對模型比調優更重要，採用gemma-4-26b-a4b-it-claude-opus-heretic-ara模型實現極致生成速度。

19.8k 1 小時前

讓 AI 跑在自家電腦上：AMD 發佈 RyzenClaw 與 RadeonClaw 參考方案

AMD推出開源框架OpenClaw及配套硬件參考配置，旨在推動“Agent Computer”計劃，讓開發者能在本地PC運行大型語言模型和多智能體工作流，提升隱私安全並降低對雲端依賴。目前主要通過Windows平臺的WSL2運行，支持本地推理。

12.4k 5 小時前

讓 AI 跑在自家電腦上：AMD 發佈 RyzenClaw 與 RadeonClaw 參考方案

華碩推“即插即用”AI加速卡UGen300：40 TOPS算力塞進USB，讓普通電腦秒變AI終端

華碩推出UGen300 AI加速卡，採用USB接口設計，無需拆機或佔用PCIe插槽，通過USB 3.1 Gen2線纜即可爲PC、工控機等設備提供40 TOPS的本地AI推理能力。核心搭載Hailo-10H NPU芯片，功耗僅2.5瓦，板載8GB內存，支持直接運行大型預訓練模型。

26.7k 昨天

AI產品

Trieve Vector Inference

快速的本地矢量推理解決方案

模型訓練與部署

8.4k

llmc

將自然語言描述轉化為可執行的shell命令的本地推理命令行工具。

開發與工具

10.2k

DiffusionKit

在蘋果硅片上運行擴散模型的推理工具。

AI圖像生成

6.4k

PowerInfer

高速大型語言模型本地部署推理引擎

AI模型

15.5k

模型

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

qwen3-vl-plus

Alibaba

輸入tokens/百萬

$10

輸出tokens/百萬

256

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen3-Next-80B-A3B-Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Kimi-K2

Moonshot

輸入tokens/百萬

$16

輸出tokens/百萬

256

上下文長度

Doubao-1.5-pro-32k

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

qwen-vl-plus

Alibaba

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qianfan-VL-70B

Baidu

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qianfan-VL-8B

Baidu

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen-mt-image

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

DeepSeek-V3.1

Deepseek

輸入tokens/百萬

$12

輸出tokens/百萬

128

上下文長度

MCP

Mcp Llm Sandbox

mcp-scaffold是一個用於驗證模型上下文協議（MCP）服務器的開發沙箱，提供本地LLM（如LLaMA 7B）和雲端推理支持，包含聊天界面和參考架構。

typescript

8.9k

2.5分

Claude LMStudio Bridge_V2

Claude-LMStudio-Bridge是一個連接Claude與本地LM Studio運行的大語言模型的MCP服務器，支持雙向通信和模型對比。

python

12k

2.5分

Deepseek R1 Reasoner

本地化運行的智能代理系統，結合推理模型與工具調用模型

typescript

6.7k

2.5分

Rlm

RLM MCP服務器是一個基於遞歸語言模型模式的大規模上下文處理工具，允許Claude代碼通過外部變量處理超過1000萬token的文本，避免直接將海量內容輸入提示詞。它通過加載、分塊、子查詢和聚合的流程，支持自動分析和程序化執行，可連接Claude API或本地Ollama進行免費推理。

python

4.4k

2.5分

Ollama MCP Bridge WebUI

一個連接本地LLM與MCP服務器的TypeScript橋樑項目，提供Web界面使開源模型能使用類似Claude的工具能力，支持文件系統、網絡搜索和複雜推理等功能。

typescript

9.9k

2.5分

Counsel Mcp

Counsel MCP服務器是一個開源工具，通過Model Context Protocol將AI助手連接到Counsel戰略推理平臺，支持多視角分析和辯論式諮詢，提供本地和託管兩種部署方式。

typescript

6.6k

2.5分

Deepseek Thinker Mcp

Deepseek Thinker MCP Server是一個提供Deepseek推理內容的MCP服務，支持OpenAI API和本地Ollama兩種模式，可集成到AI客戶端中。

typescript

8.7k

2.5分

Clarifai Mcp Server Local

該項目是一個非官方的Clarifai MCP服務器，作為本地橋樑連接Clarifai API，支持圖像生成、推理和搜索等功能，通過標準MCP協議與客戶端交互。

5.1k

2.5分

Skill Router Mcp

一個輕量級MCP服務器，通過FunctionGemma模型實現智能技能匹配，讓AI代理按需獲取專用技能，避免上下文窗口過載。

rust

9.2k

2.0分

Web Llm Mcp Server

一個基於Playwright和Web-LLM的本地LLM推理MCP服務器，通過瀏覽器自動化實現文本生成、聊天交互和模型管理功能。

typescript

5.5k

2.0分

Massive Context Mcp

一個基於遞歸語言模型模式的MCP服務器，通過分塊、子查詢和本地推理處理超大規模上下文（1000萬+令牌），支持自動分析、代碼執行和安全過濾。

python

2.0分

Minirag Mcp

MiniRAG-MCP是一個MCP服務器包裝器，圍繞MiniRAG項目構建，旨在通過客戶端管理的LLM推理採樣，為本地設備上的智能體流程提供高效、可靠的檢索增強生成（RAG）服務。

python

9.8k

2.0分

Mcp Scaffold

mcp-scaffold是一個用於驗證模型上下文協議（MCP）服務器的沙盒環境，支持本地和雲端LLM推理，提供聊天界面和參考架構。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

不做AI產品做AI增強：Ubuntu官宣 2026 年全面集成原生AI

本地推理“超進化”！Claude Code 對接魔改版 Gemma 4：速度暴增 5 倍，CRUD 開發利器

​讓 AI 跑在自家電腦上：AMD 發佈 RyzenClaw 與 RadeonClaw 參考方案

華碩推“即插即用”AI加速卡UGen300：40 TOPS算力塞進USB，讓普通電腦秒變AI終端

AI產品

Trieve Vector Inference

llmc

DiffusionKit

PowerInfer

模型

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Gemini 2.5 Flash-Lite

qwen3-vl-plus

qwen3-max

qwen3-coder-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

qwen-vl-plus

Qianfan-VL-70B

Qianfan-VL-8B

qwen-mt-image

DeepSeek-V3.1

Qwen3 Coder 30B A3B Instruct F32

Qwen3 Coder 30B A3B Instruct

GLM 4.5 Air Mxfp4

Qwen3 14B

Qwen3 Next 80B A3B Thinking Mxfp4 Mlx

Sleeper Proxy Tinyllama 1.1b Gguf

Instinct GGUF

Gpt Oss 20b GGUF

Hermes 4 14B 8bit

Llama 3.1 8b Roleplay Airtel Gguf

Gpt Oss 20b Mxfp4 Gguf

Llama 3_3 Nemotron Super 49B V1_5 Mlx 8Bit

Mookiezi_Discord Micae Hermes 3 3B GGUF

Huihui Ai_Huihui Qwen3 1.7B Abliterated V2 GGUF

Affine 8888888

Gpt Oss 20b GGUF

Gpt Oss 20b Dequantized

Gpt Oss 20b Bnb 4bit

Gpt Oss 20b GGUF

Higgs Gguf

MCP

Mcp Llm Sandbox

Claude LMStudio Bridge_V2

Deepseek R1 Reasoner

Rlm

Ollama MCP Bridge WebUI

Counsel Mcp

Deepseek Thinker Mcp

Clarifai Mcp Server Local

Skill Router Mcp

Web Llm Mcp Server

Massive Context Mcp

Minirag Mcp

Mcp Scaffold

讓 AI 跑在自家電腦上：AMD 發佈 RyzenClaw 與 RadeonClaw 參考方案