馬斯克批評政府醫療體系效率低下,提出由AI大模型Grok進行智能診斷,特斯拉人形機器人執行手術護理,以實現高效普惠醫療。
面壁智能獲數億元融資,將用於端側高效大模型研發與生態建設,鞏固其在邊緣智能領域的領先地位。作爲國內端側大模型先行者,公司已形成從理論到產品的技術閉環,核心產品MiniCPM“面壁小”系列表現突出。
面壁智能完成數億元融資,投資方包括京國瑞、國科投資等。資金將重點投入端側高效大模型的研發,以鞏固其在終端智能市場的技術優勢。作爲國內端側AI領域的先行者,公司已構建從理論到全場景產品的完整體系。
大模型競賽進入“落地攻堅”階段,火山引擎提出AI演進新範式:智能Agent成爲AI落地核心載體,多模態能力與高效開發體系是關鍵。大模型正從問答交互轉向深入汽車、製造等複雜場景,實現從“聊天”到“幹活”的跨越。
AI驅動的面試平臺,助力智能招聘、自動篩選候選人,高效招聘。
智能化的 AI 工作流助手,助您高效完成任務。
全球首個帶推理智能與16位HDR輸出的AI視頻模型,創作高效專業
智能編碼助手,提供高效、智能的編程體驗。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
-
Anthropic
$105
$525
200
$7
$35
$21
Alibaba
$1
$10
256
$4
$16
$2
$20
Baidu
128
$15.8
$12.7
64
$3.9
$15.2
Moonshot
Bytedance
$0.8
$0.15
$1.5
32
Xai
$1.4
$10.5
Deepseek
$12
unsloth
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家模型,總參數達2300億,激活參數為100億。該模型在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
Qwen
Qwen3-VL-2B-Thinking是Qwen系列中最強大的視覺語言模型之一,採用GGUF格式權重,支持在CPU、NVIDIA GPU、Apple Silicon等設備上進行高效推理。該模型具備出色的多模態理解和推理能力,特別增強了視覺感知、空間理解和智能體交互功能。
Qwen3-VL是通義系列中最強大的視覺語言模型,具備出色的文本理解和生成能力、深入的視覺感知和推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及智能體交互能力。本倉庫提供GGUF格式權重,支持在CPU、GPU等設備上高效推理。
redponike
MiniMax-M2是一款專為高效編碼和智能體工作流打造的混合專家模型,具備2300億總參數和100億激活參數。該模型在編碼和智能體任務中表現卓越,同時具有低延遲、低成本和高吞吐量的特點,能有效提升工作效率。
bullerwins
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的小型混合專家(MoE)模型。它擁有2300億總參數,僅激活100億參數,在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的'迷你'模型。它是一個緊湊、快速且經濟高效的混合專家(MoE)模型,在編碼和智能體任務中表現卓越,同時還具備強大的通用智能。
MiniMaxAI
MiniMax-M2是一款專為最大化編碼和智能體工作流程而構建的'迷你'模型,採用混合專家架構,總參數2300億,激活參數100億。該模型在編碼和智能體任務中表現卓越,同時保持強大的通用智能,具有緊湊、快速且經濟高效的特點。
quwsarohi
NanoAgent是一個緊湊的智能大語言模型,擁有1.35億參數和8k上下文長度。它專門針對工具調用和指令遵循進行了優化,能夠在個人設備上高效運行,支持輕量級推理和ReAct風格的交互。
QuantTrio
GLM-4.6-AWQ是基於zai-org/GLM-4.6基礎模型的量化版本,具備高效的文本生成能力。相比GLM-4.5,該模型在上下文窗口、編碼性能、推理能力和智能體功能等方面都有顯著提升。
vito95311
這是Qwen3-Omni 31.7B參數模型的專業量化版本,採用先進的INT8+FP16混合精度量化技術,內存使用減少50%以上,支持智能GPU/CPU混合推理,讓大型多模態模型能夠在消費級硬件上高效運行。
QuantFactory
Instinct是基於Qwen2.5-Coder-7B的代碼編輯模型,經過真實世界代碼編輯數據集微調,能夠智能預測開發者的下一步操作,保持流暢編程狀態。該GGUF量化版本由QuantFactory創建,提供高效的本地推理能力。
openai
GPT-OSS系列是OpenAI推出的開放權重模型,專為強大的推理能力、智能體任務和多樣化開發者用例設計。該模型能有效解決複雜問題,提供靈活高效的使用體驗,支持Apache 2.0開源許可證。
Menlo
Lucy是一款專注於智能網頁搜索和輕量級瀏覽的17億參數模型,基於Qwen3-1.7B構建,優化後可在移動設備上高效運行。
osunlp
WebDreamer 是一個規劃框架,能夠為現實世界中的網頁智能體任務實現高效且有效的規劃。
praneethposina
這是一個由微調後的LLaMA 3.1 8B模型驅動的端到端客戶支持聊天機器人解決方案,能為客戶支持場景提供高效、智能的交互服務。
Solana-MCP是一個基於Solana區塊鏈的全鏈操作平臺,通過自然語言命令簡化用戶與Solana生態的交互,支持DApp集成、數字資產管理、DeFi操作等功能,利用LLM技術和智能合約實現高效安全的鏈上操作。
基於MCP協議的智能任務管理系統,提供AI代理的高效編程工作流框架,具備任務規劃、分解、執行和記憶功能。
MCP開發框架是一個用於創建與大語言模型交互自定義工具的強大框架,提供文件處理、網頁內容獲取等功能,支持PDF、Word、Excel等多種格式,具有智能識別、高效處理和內存優化等技術特點。
一個基於MCP SDK和Crawl4AI的生產級潛在客戶生成系統,支持多源數據聚合、智能緩存和高效併發處理,實現從發現到豐富的全生命週期管理。
Code Index MCP是一個基於模型上下文協議(MCP)的代碼索引分析服務器,提供代碼搜索、文件分析、智能過濾等功能,支持多種編程語言,幫助開發者高效管理代碼庫。
MCP開發框架是一個用於與大語言模型交互的強大工具集,提供文件處理(PDF/Word/Excel)、網頁內容獲取等功能,支持Cursor IDE擴展,具有智能文件識別、高效處理和內存優化等技術特點。
一個集成Perplexity AI的智能研究助手,提供搜索、文檔檢索、API發現和代碼現代化檢查功能,支持上下文跟蹤和高效API管理。
這是一個為AI智能體設計的Android MCP工具包,提供SVG轉VectorDrawable、ADB日誌讀取、UI自動化及文本長度估算等工具,旨在將Android開發流程與AI代理高效連接。
MCP-Filesystem是一個專為智能交互優化的文件系統操作服務器,提供對大文件和複雜文件系統的高效管理,包括智能上下文管理、精確文件操作和高級搜索功能。
Cocos MCP日誌橋是一個連接Cocos Creator編輯器和Cursor AI的日誌同步工具,提供即時日誌傳輸、智能過濾和場景管理功能,幫助開發者高效調試。
一個智能高效的Grafana Tempo MCP服務器,具備查詢格式自動識別、正確URL編碼和人性化響應等功能,解決了官方版本的多個問題。
基於MCP協議的引力波信號檢測與優化系統,專注於GW150914事件分析,通過AI智能探索參數空間實現高效信號檢測
基於Cloudflare Workers的智能圖標搜索推薦服務,通過多算法語義匹配實現高效圖標發現
Distri是一個基於Rust的可組合AI代理框架,支持通過MCP協議構建和組合智能代理能力,提供模塊化設計和高效性能。
基於Model Context Protocol(MCP)的智能任務管理系統,為AI代理提供高效編程工作流框架,具備任務規劃、分解、依賴管理、驗證和記憶等功能。
DeepMyst MCP Server是一個智能LLM優化與路由服務,為Claude Desktop和HTTP客戶端提供高效的模型選擇與令牌優化功能,支持多種傳輸方式和多LLM提供商集成。
Hi-AI是基於模型上下文協議(MCP)的AI開發助手,提供36個專業工具,支持自然語言關鍵詞識別、智能內存管理、代碼分析、項目規劃和任務管理,幫助開發者高效完成複雜開發任務。
Google Workspace MCP服務器是一個通過Model Context Protocol協議連接Google工作套件(Gmail、日曆、Drive等)的服務,提供自動化郵件管理、智能日曆調度和高效文件管理功能,支持多賬戶安全認證和開發者自定義集成。
一個基於PDF文檔分析的智能學習輔助系統,提供文檔轉換、內容組織和問題生成功能,幫助用戶高效學習。
Fluent MCP是一個用於構建具有智能推理能力的模型上下文協議(MCP)服務器的現代框架,支持AI集成、工具分離和複雜推理卸載,採用雙層LLM架構實現高效推理。