Anthropic發佈旗艦模型Claude Opus4.5,在編碼、智能代理操作和電腦使用等關鍵生產力場景達到世界領先水平,同時在研究、演示文稿等常見任務上也有顯著提升。核心能力包括推理與長期任務管理,軟件工程能力在真實測試中表現卓越。
OceanBase在2025年度發佈會上開源AI數據庫seekdb,支持三行代碼快速構建知識庫和智能體應用,處理百億級多模數據檢索。產品提供向量、全文、標量及空間地理數據的統一混合搜索,深度融合AI推理與數據處理,兼容Hugging Face等30多種主流AI框架,實現“開箱即用”的AI數據基座。
谷歌推出DS STAR多智能體框架,可將模糊商業問題自動轉化爲可執行Python代碼,無需人工介入。該框架突破傳統依賴結構化SQL數據庫的限制,能直接處理CSV、JSON、Markdown及非結構化文本等混合格式數據。通過Aanalyzer等組件分階段實現從問題分析到代碼生成的全流程自動化。
國產團隊Moonshot AI發佈Kimi Linear架構技術報告,提出可替代完全注意力機制的混合線性架構。該架構在速度、內存效率和長上下文處理三方面實現突破,顯著降低KV緩存使用,兼具高效與性能優勢,被譽爲智能體時代注意力機制新起點。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
-
Anthropic
$105
$525
200
$7
$35
$21
Alibaba
$1
$10
256
$2
$20
$4
$16
Baidu
128
$15.8
$12.7
64
$3.9
$15.2
Bytedance
$0.8
$0.15
$1.5
32
Xai
$1.4
$10.5
Deepseek
$12
Kiy-K
Fyodor-StarCoder2-7B-MoE是基於StarCoder2-7B的增強版本,採用混合專家架構,擁有3個MoE層、6個專家網絡和top-2路由機制,在代碼生成、函數調用和智能體任務方面表現優異。
unsloth
Qwen3-Coder-REAP-363B-A35B是通過REAP方法對Qwen3-Coder-480B-A35B-Instruct進行25%專家剪枝得到的稀疏混合專家模型,在保持接近原模型性能的同時顯著降低了參數規模和內存需求,特別適用於資源受限的代碼生成和智能編碼場景。
Qwen3-VL是通義系列中最強大的視覺語言模型,在文本理解與生成、視覺感知與推理、上下文長度、空間和視頻動態理解以及智能體交互能力等方面全面升級。該模型提供密集架構和混合專家架構,支持從邊緣設備到雲端的靈活部署。
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家模型,總參數達2300億,激活參數為100億。該模型在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
Qwen3-VL是迄今為止Qwen系列中最強大的視覺語言模型,在文本理解與生成、視覺感知與推理、上下文長度、空間和視頻動態理解以及智能體交互能力等方面都進行了全面升級。該模型採用混合專家(MoE)架構,提供卓越的多模態處理能力。
Qwen3-VL是通義大模型系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力以及出色的智能體交互能力。該模型採用混合專家(MoE)架構,是增強推理的思維版。
Qwen3-VL是通義系列中最強大的視覺語言模型,在文本理解與生成、視覺感知與推理、上下文長度、空間和視頻動態理解以及智能體交互能力等方面都進行了全面升級。該模型提供密集架構和混合專家架構,支持從邊緣設備到雲端的靈活部署。
redponike
MiniMax-M2是一款專為高效編碼和智能體工作流打造的混合專家模型,具備2300億總參數和100億激活參數。該模型在編碼和智能體任務中表現卓越,同時具有低延遲、低成本和高吞吐量的特點,能有效提升工作效率。
bullerwins
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家(MoE)模型。它擁有2300億總參數,僅激活100億參數,在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的'迷你'模型。它是一個緊湊、快速且經濟高效的混合專家(MoE)模型,在編碼和智能體任務中表現卓越,同時還具備強大的通用智能。
MiniMaxAI
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的'迷你'模型,採用混合專家架構,總參數2300億,激活參數100億。該模型在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
Qwen3-VL-32B-Thinking是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。該版本採用增強推理的思維架構,支持從邊緣到雲的密集架構和混合專家模型架構。
Qwen
Qwen3-VL是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。該版本採用混合專家模型架構,支持增強推理思維功能。
vito95311
這是Qwen3-Omni 31.7B參數模型的專業量化版本,採用先進的INT8+FP16混合精度量化技術,內存使用減少50%以上,支持智能GPU/CPU混合推理,讓大型多模態模型能夠在消費級硬件上高效運行。
Qwen3-VL是通義大模型系列中最強大的視覺語言模型,在文本理解與生成、視覺感知與推理、上下文長度、空間和視頻動態理解以及智能體交互能力等方面均有顯著提升。該模型提供密集架構和混合專家模型架構,支持從邊緣到雲的不同規模部署。
chaoyinshe
EchoVLM是一個專為醫學超聲領域設計的動態專家混合視覺語言模型,能夠處理圖像和文本輸入並生成文本輸出,在超聲智能診斷中具有重要應用價值。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的開放權重模型,專為強大推理、智能體任務和多樣化開發者用例設計。該模型具有210億參數(其中36億為活躍參數),採用混合專家架構,支持低延遲本地部署和特定場景應用。
QuantTrio
DeepSeek-V3.1是基於DeepSeek-V3.1-Base進行後訓練的大型語言模型,具有128K上下文長度,支持混合思維模式、智能工具調用和代碼代理功能。該模型在多項基準測試中表現出色,特別在數學推理、代碼生成和搜索代理任務上有顯著提升。
cpatonn
GLM-4.5-Air-AWQ是基於GLM-4.5-Air基礎模型的8位量化版本,專為智能代理設計,採用混合推理模式,支持複雜推理和即時響應,在MIT開源許可下發布。
Kimi K2是一款先進的混合專家(MoE)語言模型,具備320億激活參數和1萬億總參數,針對智能代理能力進行了優化。
一個用於獲取和搜索第三方軟件包文檔的MCP服務器,支持多源抓取、智能處理和混合搜索。
這是一個針對石油天然氣行業的MCP+RAG概念驗證項目,通過智能路由將用戶查詢自動分發到正確的領域服務(如鑽井、生產、採購等),並結合混合檢索技術從文檔中獲取精準信息,提供帶引用的答案,實現跨域數據的快速統一訪問。
ClaudeHopper是一個基於AI的建築文檔輔助工具,通過RAG和混合搜索技術實現與施工圖紙、規範文檔的智能交互。
一個高性能的MCP服務器,用於語義代碼搜索,採用Rust編寫,支持混合搜索(BM25+向量嵌入)、AST智能分塊和60多種編程語言。
一個多功能文檔處理MCP服務器,支持從多種來源抓取、處理並智能檢索第三方軟件包文檔,集成OpenRouter多模型API,提供混合搜索能力。
基於iFlytek的MCP服務器實現,支持智能工作流調度與多模型混合應用架構。
一個輕量級MCP服務器,專注於爬取文檔網站並使用Jina AI和Supabase進行RAG索引,支持多項目管理、智能URL發現和混合內容提取。