谷歌在Cloud Next 26大會上發佈“代理企業”核心基礎設施,全面重塑AI架構,推動競爭進入以自主智能體爲核心的生產力時代。關鍵更新包括:首次將第八代TPU拆分爲專用訓練版本TPU8t和推理優化版本TPU8i,實現底層算力的“拆分”與“規模”革命。
OpenAI更新Agents SDK,新增沙箱功能,讓智能代理在受控環境中運行,提升企業構建自動化助手的安全性與效率。
Anthropic正爲Claude開發常駐代理Conway,打造獨立運行、始終在線的智能環境。它將擁有獨立UI,超越傳統聊天界面,作爲代理工作空間運行。Conway可直接操作瀏覽器、連接外部工具,並集成代碼功能,實現深度任務處理與代碼執行。
2026年AI進入“全自動代理”時代,開源框架OpenClaw引發“龍蝦大戰”,市場涌現超20款智能體產品,月費19至899元不等。這些AI“龍蝦”不僅能對話,更能直接獲取系統權限執行任務,從自動化處理文檔到遠程操控電腦,深度集成企業辦公生態,AI正從“建議者”轉變爲真正的執行者。
一個開源的個人智能代理,隨著使用時間的增長而不斷學習和提升。
輕鬆構建、部署和管理 AI 代理,創建智能自動化工作流程和對話式 AI 代理。
構建智能預測代理,連接人類與AI,用於多領域精準推理。
EverMind賦予AI無限記憶與長期一致性,含開源內存系統及先進模型。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
-
Anthropic
$105
$525
200
$7
$35
$21
Alibaba
$1
$10
256
$4
$16
$2
$20
Baidu
128
$15.8
$12.7
64
$3.9
$15.2
Bytedance
$0.8
$0.15
$1.5
32
Xai
$1.4
$10.5
Deepseek
$12
$54
$163
FractalAIResearch
Fathom-DeepResearch是一個智能深度研究系統,由兩個專門的4B參數模型組成:Fathom-Search-4B針對長時證據搜索優化,Fathom-Synthesizer-4B用於開放式合成和報告生成。該系統在多個搜索密集型基準測試中取得了最先進的性能,並在開放式合成基準測試上超越了多個閉源深度研究代理。
QuantTrio
DeepSeek-V3.1是基於DeepSeek-V3.1-Base進行後訓練的大型語言模型,具有128K上下文長度,支持混合思維模式、智能工具調用和代碼代理功能。該模型在多項基準測試中表現出色,特別在數學推理、代碼生成和搜索代理任務上有顯著提升。
cpatonn
GLM-4.5-Air-AWQ是基於GLM-4.5-Air基礎模型的8位量化版本,專為智能代理設計,採用混合推理模式,支持複雜推理和即時響應,在MIT開源許可下發布。
unsloth
GLM-4.5是為智能代理設計的基礎模型,統一了推理、編碼和智能代理能力,總參數達3550億,在12個行業標準基準評估中排名第3,得分63.2。採用MIT開源許可,可用於商業和二次開發。
GLM-4.5-AWQ是基於GLM-4.5基礎模型的4位量化版本,採用先進的AWQ量化方法,在保持較好性能的同時顯著提升推理效率。該模型專為智能代理設計,統一了推理、編碼和智能代理能力。
GLM-4.5-Air-AWQ是GLM-4.5-Air模型的量化版本,通過AWQ量化技術提升推理效率,同時保持較高性能。該模型擁有106億參數,其中12億為活躍參數,專為智能代理設計,支持複雜推理和即時響應兩種模式。
GLM-4.5-Air-AWQ 是基於 zai-org/GLM-4.5-Air 基礎模型進行4位AWQ量化的文本生成模型,專為智能代理應用設計,在推理、編碼和智能代理能力方面表現優異,採用MIT開源許可證。
Kimi K2是一款先進的混合專家(MoE)語言模型,具備320億激活參數和1萬億總參數,針對智能代理能力進行了優化。
Mungert
Arch-Agent-3B GGUF是一款專為高級函數調用和基於代理的應用程序設計的大語言模型,擅長處理複雜多步任務,支持智能工具選擇和自適應規劃。
lmstudio-community
基於Transformer架構的圖像文本到文本生成模型,專為計算機/GUI相關場景設計,具備智能代理能力。
Devstral是一款專為軟件工程任務設計的智能大語言模型,由Mistral AI和All Hands AI合作開發,擅長代碼庫探索、多文件編輯和驅動軟件工程代理。
Devstral是一款專為軟件工程任務設計的智能LLM,由Mistral AI和All Hands AI合作開發,擅長代碼探索、多文件編輯和驅動軟件工程代理。
mistralai
Devstral是一款專為軟件工程任務設計的智能大型語言模型,由Mistral AI和All Hands AI合作開發,擅長代碼探索、編輯和驅動軟件工程代理。
Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能大語言模型,擅長代碼庫探索、多文件編輯和驅動軟件工程代理。
Alhdrawi
Qwen2.5-VL-32B-Instruct是Qwen家族的最新視覺語言模型,具備強大的視覺理解和智能代理能力,支持多模態任務處理。
Benasd
Qwen2.5-VL是通義千問團隊推出的多模態大語言模型,具備強大的視覺理解和智能代理能力,支持圖像、視頻、文本等多種輸入格式。
migtissera
SynthIA(合成智能代理)是基於Orca風格數據集訓練的LLama-2-70B模型,擅長遵循指令及進行長對話。
Haiku RAG是一個基於LanceDB、Pydantic AI和Docling構建的智能檢索增強生成系統,支持混合搜索、重排序、問答代理、多代理研究流程,並提供本地優先的文檔處理和MCP服務器集成。
Crawl4AI RAG MCP Server是一個集成網絡爬蟲和RAG功能的AI代理服務,支持智能URL檢測、遞歸爬取、並行處理和向量搜索,旨在為AI編碼助手提供強大的知識獲取和檢索能力。
AI基礎設施代理是一個智能系統,允許用戶通過自然語言命令管理AWS雲資源。它利用AI模型將用戶需求轉化為可執行的AWS操作,並提供Web儀表板、狀態管理和安全防護功能。
基於多智能體系統(MAS)的高級順序思維處理工具,通過協調多個專業代理進行深度分析和問題分解
基於MCP協議實現的Claude代碼編輯與執行服務
Pixelle MCP是一個基於MCP協議的全模態AIGC解決方案,可將ComfyUI工作流零代碼轉換為MCP工具,實現LLM與ComfyUI的無縫集成。
Zen7支付代理是首個DePA去中心化支付代理的實踐實現,採用多智能體協作架構,支持A2A和MCP協議,為AI智能體和Dapp應用提供多鏈多幣種支付解決方案,實現自動化加密支付和LLM驅動的意圖識別。
基於MCP協議的智能任務管理系統,提供AI代理的高效編程工作流框架,具備任務規劃、分解、執行和記憶功能。
ATLAS是一個基於TypeScript和Neo4j構建的智能任務與知識管理系統,專為LLM代理設計,提供項目、任務和知識的三層管理架構。
DomainKits MCP是一個為AI助手設計的域名智能代理框架,集成了域名搜索、分析、監控、趨勢發現和批量處理等工具,可將通用AI助手轉變為具備行業領域知識的專業域名代理。
Neo N3 Model Context Protocol (MCP) 是一個標準化的接口協議,用於AI代理和應用程序與Neo N3區塊鏈的交互。它提供了簡單易用的服務器實現,支持通過npx直接運行,無需手動配置環境。協議包含區塊鏈信息查詢、錢包管理、資產轉移、智能合約交互等功能,並額外提供了HTTP服務器以RESTful API形式暴露功能。
manim-mcp 是一個基於 manimgl 庫的文本轉視頻動畫生成工具,通過多智能體 LLM 流水線將自然語言描述轉換為高質量數學動畫,可作為 CLI 工具、AI 代理或 MCP 服務器與 Claude 等助手集成。
Fetch Browser是一個強大的無頭瀏覽器MCP服務器,專為AI代理設計,無需API密鑰即可獲取網頁內容和執行Google搜索。支持多種內容格式轉換和智能錯誤處理。
百度智能雲曦靈數字人開放平臺提供基於MCP協議的13個API接口,支持數字人視頻生成、音色克隆等功能,兼容多種MCP代理助手快速接入。
MCP代理工具,通過單一查詢接口智能調用多個上游MCP服務,節省上下文窗口資源
FHIR MCP Server 是一個基於 FastMCP 框架的醫療數據管理服務器,提供完整的模型上下文協議(MCP)實現,支持 LLM 代理與 FHIR 兼容後端的交互。它提供標準化的接口,支持對 FHIR 資源的全面 CRUD 操作,並通過一系列工具實現智能文檔處理和語義搜索。
MoLing-MineCraft是一個Minecraft遊戲的AI代理MCP服務器,通過自然語言交互實現智能建造與控制。
OmniMind是一個開源的Python庫,旨在簡化Model Context Protocol(MCP)集成,支持AI代理、工作流和自動化開發。它提供即插即用功能,內置多種工具,並基於Google Gemini提供智能響應,適合開發者和初學者快速構建AI應用。
Agent Farm v3.4是一個基於AI智能體進化和並行任務執行的系統,通過工具增強的代理實現任務處理。新版本引入了分塊寫入模式,支持並行生成大型文檔和代碼文件,性能提升8.6倍,並利用本地模型進行結果合成,無需依賴雲端令牌。
Vaali MCP服務器是一個展示高級AI代理能力的開源項目,通過交互式參數收集和工作流自動化,實現了官方MCP詢問和智能參數引導兩種模式,支持雲端部署和本地集成。