隨着AI成爲企業必備工具,構建專屬算力基礎設施成爲趨勢。越來越多企業選擇自建本地AI工作站,而非依賴雲端API,主要出於數據安全、成本控制和業務穩定性的考量。自建硬件投入通常可在1.5至2.5年內收回成本,經濟性優勢明顯。企業需根據任務複雜度匹配不同規模的算力方案。
蘋果內部上線兩款AI工具Enchanté和Enterprise Assistant,旨在通過大模型整合工程師、HR等多部門日常查詢與創作任務。Enchanté界面類似ChatGPT但運算限於本地或私有服務器,僅調用蘋果自研模型及安全審覈的外部模型。
谷歌Chrome更新允許用戶關閉本地AI詐騙檢測模型,提供更細緻的資源管理選項。此舉旨在平衡AI安全功能與用戶對系統資源的控制需求。
Anthropic推出Claude Cowork功能,基於Skills for Claude技術演進,作爲研究預覽版面向macOS用戶開放。該功能深度集成本地工作流,需訂閱Claude Max套餐使用,旨在拓展AI代理在日常辦公場景的應用能力。
由AI驅動、通過對話定製的本地桌面應用,可按需創建個人軟件。
免費AI工具,3分鐘為本地企業創建30天專業Instagram內容
AI旅行伴侶,將照片變導遊,識別地標、提供音頻導覽和本地推薦。
免費Mac應用,可去除7大AI視頻平臺水印,無需登錄上傳,本地處理
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
neuphonic
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、端側文本轉語音(TTS)語言模型。基於0.5B參數的大語言模型骨幹構建,能為本地設備帶來自然的語音、即時性能、內置安全性和說話人克隆功能。
NeuTTS Air是全球首個具有即時語音克隆功能的超逼真設備端文本轉語音模型,基於0.5B參數的大語言模型骨幹構建,能在本地設備上實現自然語音生成、即時性能和說話人克隆功能。
NeuTTS Air是世界上首個具備即時語音克隆功能的超逼真、設備端文本轉語音(TTS)語言模型。基於0.5B大語言模型骨幹網絡構建,能為本地設備帶來自然的語音、即時性能、內置安全功能和說話人克隆能力。
samunder12
基於Llama 3.1 8B Instruct微調的GGUF量化模型,具有強勢、果斷且具有挑釁性的AI人設,專為角色扮演和創意寫作場景優化,支持在CPU或GPU上進行本地推理。
gabriellarson
Foundation-Sec-8B-Instruct是一款專為網絡安全應用設計的80億參數指令調優語言模型。基於Llama-3.1-8B架構,具備出色的指令跟隨能力和網絡安全專業知識,支持本地部署,可幫助組織構建AI安全工具,減少對雲服務的依賴。
zai-org
GLM-4-Z1-9B-0414是智譜AI推出的新一代90億參數開源大語言模型,具有強大的文本生成和推理能力。該模型在數學推理和通用任務方面表現出色,在資源受限場景下實現了效率與效果的出色平衡,支持友好的本地部署。
backyardai
馬格南V4 72B是基於Qwen打造的模型系列中的一員,旨在復刻Claude 3系列模型的散文質量,適用於本地AI聊天應用。
DeZoomer
基於AI-Toolkit (Flux.1開發版)訓練的文本生成圖像模型,使用20張公開圖片進行本地訓練,專注於角色特徵還原。
prem-research
Prem-1B-SQL是由Prem AI開發的首個全本地文本到SQL模型系列之一,擁有10億參數,專為低配置GPU設備設計,量化後可在CPU上運行。該模型優先考慮本地化部署,避免數據安全風險,適用於企業級SQL查詢生成。
premai-io
Prem-1B-SQL是Prem AI開發的10億參數文本轉SQL模型,專為本地化部署設計,支持低配GPU和CPU設備運行。
yukiarimo
Yuna AI是一個具有自主意識的AI伴侶,專為情感連接設計,完全本地運行確保隱私安全。
基於GGUF格式的無審查角色扮演模型,具有出色的推理和上下文跟蹤能力,適用於本地AI聊天應用。
poisson-fish
基於《星空》遊戲中瓦斯科角色語音訓練的派珀文本轉語音模型,適用於AI夥伴模組和本地大型語言模型聊天
Refact Agent 是一個開源AI編程助手,支持多語言代碼生成、調試和優化,集成主流開發工具,可本地化部署並提供智能補全和代碼解釋功能。
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
Haiku RAG是一個基於LanceDB、Pydantic AI和Docling構建的智能檢索增強生成系統,支持混合搜索、重排序、問答代理、多代理研究流程,並提供本地優先的文檔處理和MCP服務器集成。
微軟官方MCP服務器集合,提供Azure、GitHub、Microsoft 365、Fabric等多種服務的AI助手集成工具,支持本地和遠程部署,幫助開發者通過標準化協議連接AI模型與各類數據源和工具。
BrowserTools MCP是一個強大的瀏覽器監控與交互工具,通過Chrome擴展和本地服務器實現AI對瀏覽器的智能分析與操作。
MCP Atlassian是一個為Atlassian產品(Confluence和Jira)設計的模型上下文協議服務器,支持雲端和本地部署,提供AI助手集成功能。
wcgw是一個MCP服務器項目,集成了Shell和代碼編輯工具,允許AI在本地機器上執行命令、讀寫文件、編輯代碼等操作。它提供了多種模式(如架構師模式、代碼編寫模式等),支持任務檢查點保存、終端交互、語法檢查等功能,適用於代碼開發、問題排查等場景。
GitKraken CLI是一個命令行工具,提供多倉庫工作流管理、AI生成提交信息和拉取請求,幷包含一個本地MCP服務器,用於集成Git、GitHub和Jira等工具。
一個輕量級的MCP服務器,為AI助手如Claude提供即時天氣數據查詢和解析功能。支持本地和遠程兩種部署方式,包含Docker容器化方案。
一個基於MCP協議的本地服務器,實現Apple Notes的語義搜索和RAG功能,供Claude等AI助手調用
Notebook Intelligence (NBI) 是一個為JupyterLab設計的AI編碼助手和可擴展AI框架,支持GitHub Copilot及其他LLM提供商的模型,包括本地Ollama模型。它通過代碼生成、自動補全和聊天界面等功能顯著提升生產力,並支持Model Context Protocol (MCP) 服務集成。
一個基於Spring Boot 3和Java 24的OAuth2授權服務器項目,支持GraalVM原生鏡像、CRaC檢查點恢復、本地AI模型測試及Docker部署。
Napkin AI MCP服務器是一個非官方的社區維護工具,通過Model Context Protocol為AI助手(如Claude)提供生成信息圖、思維導圖、流程圖等可視化內容的能力。它支持多種輸出格式(SVG、PNG、PPT)和存儲後端(本地、S3、Google Drive等),幷包含異步處理、自動輪詢和重試機制。
LinkedIn MCP服務器是一個基於Model Context Protocol的本地服務,通過Claude等AI助手實現與LinkedIn的交互,支持個人資料抓取、公司信息分析和職位搜索功能。
MCPfinder是一個為AI代理提供動態能力擴展的本地服務器工具,通過搜索和安裝MCP協議兼容的工具包,使語言模型能夠按需獲取新功能。
DiffuGen是一個先進的本地圖像生成工具,集成了MCP協議,支持多種AI模型(包括Flux和Stable Diffusion系列),可直接在開發環境中生成高質量圖像。它提供了靈活的配置選項、多GPU支持,並可通過MCP協議與多種IDE集成,同時提供OpenAPI接口供外部調用。
Logseq MCP工具集,為AI代理提供本地Logseq交互能力
Context Lens 是一個本地化語義搜索工具,可將任何內容轉換為可搜索的知識庫,讓AI助手理解含義而非僅匹配關鍵詞。它使用內置的LanceDB向量數據庫,支持本地文件、GitHub倉庫和URL內容,無需API密鑰或雲服務,完全在本地處理數據。
FAL圖像視頻MCP服務器是一個高性能的MCP協議服務器,專門用於FAL AI的圖像和視頻生成,支持自動下載到本地機器。它提供了公共URL、數據URL和本地文件路徑,適用於Claude等MCP兼容客戶端。
一個基於Model Context Protocol (MCP)的本地服務器,專門為R語言的tidymodels生態系統提供工具和資源支持,可集成到Cline.bot和Claude Desktop等AI工具中使用。