小米MiMo在全球最大AI模型API聚合平臺OpenRouter上登頂全球調用量榜首,成爲首個獲此成就的國產大模型。近一個月,MiMo貢獻1.45萬億Token調用量,在300多個模型中脫穎而出。其端雲協同架構設計帶來高推理效率和低成本,實用性優先的定位獲全球開發者認可。生態上,Nous Research已與小米合作,MiMo系列全面接入增長最快的開源生態。
在AI平臺OpenRouter最新統計中,開源Agent框架Hermes Agent的調用量全球登頂,日均Token調用量達2910億,周調用量突破1.75萬億。小米自研的MiMo大模型作爲其首選推理引擎,近一個月貢獻1.45萬億Token調用量,位居所有支撐模型之首,成爲核心推動力。
Hermes Agent 智能體框架由Nous Research開發並開源,自2026年2月發佈後迅速崛起,在全球Token消耗量榜單上首次超越OpenClaw登頂首位。該智能體在調用前五大模型方面表現突出,包括小米MiMo-V2-Pro、MiniMax M2.7、英偉達Nemotron 3 Super、階躍星辰Step 3.5 Flash及騰訊Hy3 preview,展現了其在AI領域的領先地位。
小米發佈MiMo-V2.5全鏈路語音模型系列,包括三款TTS模型和一款開源ASR模型,覆蓋語音輸入與輸出。TTS模型能精準調度情緒、語氣和角色身份,讓聲音可編程、可創作、可復刻,提升人機交互自然度,開啓語音智能新紀元。
小米首個推理大模型MiMo開源,專為推理任務設計,性能卓越。
可控角色視頻合成技術
DJI 手持穩定設備專屬應用,創作無限。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
MiMo Audio是小米開發的音頻語言模型,通過大規模預訓練展現出強大的少樣本學習能力。該模型突破了傳統模型依賴特定任務微調的侷限,在語音智能、音頻理解等任務中表現出色,在開源模型中達到先進水平。
MiMo Audio是一款基於大規模預訓練的音頻語言模型,在語音智能和音頻理解基準測試中取得了開源模型的SOTA性能。該模型展現出強大的少樣本學習能力,能夠泛化到訓練數據中未包含的任務,支持語音轉換、風格遷移和語音編輯等多種音頻任務。
bartowski
這是XiaomiMiMo的MiMo-VL-7B-SFT-2508模型的量化版本,使用llama.cpp進行優化處理,旨在提升模型在特定硬件上的運行性能。該模型是一個70億參數的視覺語言模型,支持圖像到文本的生成任務。
這是小米MiMo-VL-7B-RL-2508模型的GGUF量化版本,使用llama.cpp的imatrix選項進行量化處理,支持多種量化級別,適用於不同的硬件配置和性能需求。
allura-forge
MiMo是小米專為推理任務從頭開始訓練的大語言模型系列,通過優化預訓練和後訓練策略,在數學和代碼推理任務上展現出卓越性能。項目開源了7B參數規模的多個版本,包括基礎模型、SFT模型和RL模型。
benxh
這是XiaomiMiMo/MiMo-VL-7B-RL-2508模型的GGUF量化版本,採用Q6_K量化級別。該模型是一個7B參數規模的多模態視覺語言模型,支持圖像和文本的聯合理解與生成任務。
MiMo-VL是一款緊湊且強大的視覺語言模型,結合了原生分辨率ViT編碼器、MLP投影器和MiMo-7B語言模型,在多模態推理等任務中表現出色。該模型在多個基準測試中表現優異,具備思維控制功能,用戶體驗顯著提升。
MiMo-VL是一款緊湊且強大的視覺語言模型,結合了原生分辨率ViT編碼器、MLP投影儀和專為複雜推理任務優化的MiMo-7B語言模型。通過多階段預訓練和後訓練,在多個視覺語言任務中取得了優異的成績。
MiMo是一系列專為推理任務從頭訓練的7B參數模型,通過優化預訓練和後訓練策略,在數學和代碼推理任務上表現出色。
MiMo-7B 是小米推出的專為推理任務設計的語言模型系列,包括基礎模型、SFT模型和RL模型,在數學和代碼推理任務上表現優異。
MiMo-7B-RL是基於MiMo-7B-SFT模型訓練的強化學習模型,在數學與代碼推理任務上表現出色,性能媲美OpenAI o1-mini。
小米推出的7B參數規模推理專用語言模型系列,通過優化預訓練和後訓練策略顯著提升數學與代碼推理能力
MiMo-7B-RL是基於MiMo-7B-SFT模型訓練的強化學習模型,在數學與代碼推理任務上達到與OpenAI o1-mini比肩的性能。