小米MiMo在全球最大AI模型API聚合平臺OpenRouter上登頂全球調用量榜首,成爲首個獲此成就的國產大模型。近一個月,MiMo貢獻1.45萬億Token調用量,在300多個模型中脫穎而出。其端雲協同架構設計帶來高推理效率和低成本,實用性優先的定位獲全球開發者認可。生態上,Nous Research已與小米合作,MiMo系列全面接入增長最快的開源生態。
在AI平臺OpenRouter最新統計中,開源Agent框架Hermes Agent的調用量全球登頂,日均Token調用量達2910億,周調用量突破1.75萬億。小米自研的MiMo大模型作爲其首選推理引擎,近一個月貢獻1.45萬億Token調用量,位居所有支撐模型之首,成爲核心推動力。
Hermes Agent 智能體框架由Nous Research開發並開源,自2026年2月發佈後迅速崛起,在全球Token消耗量榜單上首次超越OpenClaw登頂首位。該智能體在調用前五大模型方面表現突出,包括小米MiMo-V2-Pro、MiniMax M2.7、英偉達Nemotron 3 Super、階躍星辰Step 3.5 Flash及騰訊Hy3 preview,展現了其在AI領域的領先地位。
小米發佈MiMo-V2.5全鏈路語音模型系列,包括三款TTS模型和一款開源ASR模型,覆蓋語音輸入與輸出。TTS模型能精準調度情緒、語氣和角色身份,讓聲音可編程、可創作、可復刻,提升人機交互自然度,開啓語音智能新紀元。
數小時完成文獻綜述,搜索數百萬篇科研論文,含圖表數據,材料研發可提前試用。
小米首個推理大模型MiMo開源,專為推理任務設計,性能卓越。
快速生成個性化和富有表現力的3D會說話面部模型
可控角色視頻合成技術
Deepseek
$4
輸入tokens/百萬
$12
輸出tokens/百萬
128
上下文長度
Chatglm
-
$16
32
$2
$8
Huawei
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
MiMo Audio是小米開發的音頻語言模型,通過大規模預訓練展現出強大的少樣本學習能力。該模型突破了傳統模型依賴特定任務微調的侷限,在語音智能、音頻理解等任務中表現出色,在開源模型中達到先進水平。
MiMo Audio是一款基於大規模預訓練的音頻語言模型,在語音智能和音頻理解基準測試中取得了開源模型的SOTA性能。該模型展現出強大的少樣本學習能力,能夠泛化到訓練數據中未包含的任務,支持語音轉換、風格遷移和語音編輯等多種音頻任務。
bartowski
這是XiaomiMiMo的MiMo-VL-7B-SFT-2508模型的量化版本,使用llama.cpp進行優化處理,旨在提升模型在特定硬件上的運行性能。該模型是一個70億參數的視覺語言模型,支持圖像到文本的生成任務。
這是小米MiMo-VL-7B-RL-2508模型的GGUF量化版本,使用llama.cpp的imatrix選項進行量化處理,支持多種量化級別,適用於不同的硬件配置和性能需求。
allura-forge
MiMo是小米專為推理任務從頭開始訓練的大語言模型系列,通過優化預訓練和後訓練策略,在數學和代碼推理任務上展現出卓越性能。項目開源了7B參數規模的多個版本,包括基礎模型、SFT模型和RL模型。
benxh
這是XiaomiMiMo/MiMo-VL-7B-RL-2508模型的GGUF量化版本,採用Q6_K量化級別。該模型是一個7B參數規模的多模態視覺語言模型,支持圖像和文本的聯合理解與生成任務。
MiMo-VL是一款緊湊且強大的視覺語言模型,結合了原生分辨率ViT編碼器、MLP投影器和MiMo-7B語言模型,在多模態推理等任務中表現出色。該模型在多個基準測試中表現優異,具備思維控制功能,用戶體驗顯著提升。
MiMo-VL是一款緊湊且強大的視覺語言模型,結合了原生分辨率ViT編碼器、MLP投影儀和專為複雜推理任務優化的MiMo-7B語言模型。通過多階段預訓練和後訓練,在多個視覺語言任務中取得了優異的成績。
MiMo是一系列專為推理任務從頭訓練的7B參數模型,通過優化預訓練和後訓練策略,在數學和代碼推理任務上表現出色。
MiMo-7B 是小米推出的專為推理任務設計的語言模型系列,包括基礎模型、SFT模型和RL模型,在數學和代碼推理任務上表現優異。
MiMo-7B-RL是基於MiMo-7B-SFT模型訓練的強化學習模型,在數學與代碼推理任務上表現出色,性能媲美OpenAI o1-mini。
小米推出的7B參數規模推理專用語言模型系列,通過優化預訓練和後訓練策略顯著提升數學與代碼推理能力
MiMo-7B-RL是基於MiMo-7B-SFT模型訓練的強化學習模型,在數學與代碼推理任務上達到與OpenAI o1-mini比肩的性能。
birder-project
基於掩碼圖像建模(MIM)預訓練的ViT reg4圖像編碼器,適用於通用特徵提取或下游視覺任務
dongfangxu
該模型基於BiomedBERT,用於對MIMIC-III臨床記錄進行句子分割,預測BIO標註。
採用絕對窗口位置嵌入策略的Hiera圖像編碼器,通過掩碼圖像建模(MIM)預訓練,可作為通用特徵提取器或下游任務的骨幹網絡。
mims-harvard
TxAgent-T1是基於Llama3.1-8B-Instruct微調的醫療智能體模型,專注於個性化治療建議和藥物推理
一個使用掩碼圖像建模(MIM)預訓練的ViT-L16圖像編碼器,適用於通用特徵提取或下游任務
一個提供圖像獲取和處理功能的MCP服務器,支持從URL、本地路徑和numpy數組加載圖像,並返回base64編碼的字符串和MIME類型。
一個提供圖像獲取和處理功能的MCP服務器,支持從URL、本地路徑和numpy數組加載圖像,並返回base64編碼和MIME類型。
MCP文件系統服務器,為工作目錄中的每個文件創建資源並提供變更通知,支持.gitignore規則和MIME類型檢測
該項目是關於自動化醫療編碼的研究,提供了在MIMIC-III和MIMIC-IV數據集上訓練和評估醫療編碼模型的代碼,包括多種模型的實現和新數據集的劃分。
該項目旨在評估基於Azure PostgreSQL的MCP服務器在臨床數據分析中的性能與開發效率,通過與直接SQL查詢對比,驗證MCP抽象層能否在保持或提升運行效率的同時降低開發複雜度。