XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
MiMo Audio是小米開發的音頻語言模型,通過大規模預訓練展現出強大的少樣本學習能力。該模型突破了傳統模型依賴特定任務微調的侷限,在語音智能、音頻理解等任務中表現出色,在開源模型中達到先進水平。
MiMo Audio是一款基於大規模預訓練的音頻語言模型,在語音智能和音頻理解基準測試中取得了開源模型的SOTA性能。該模型展現出強大的少樣本學習能力,能夠泛化到訓練數據中未包含的任務,支持語音轉換、風格遷移和語音編輯等多種音頻任務。
bartowski
這是XiaomiMiMo的MiMo-VL-7B-SFT-2508模型的量化版本,使用llama.cpp進行優化處理,旨在提升模型在特定硬件上的運行性能。該模型是一個70億參數的視覺語言模型,支持圖像到文本的生成任務。
這是小米MiMo-VL-7B-RL-2508模型的GGUF量化版本,使用llama.cpp的imatrix選項進行量化處理,支持多種量化級別,適用於不同的硬件配置和性能需求。
benxh
這是XiaomiMiMo/MiMo-VL-7B-RL-2508模型的GGUF量化版本,採用Q6_K量化級別。該模型是一個7B參數規模的多模態視覺語言模型,支持圖像和文本的聯合理解與生成任務。
MiMo-VL是一款緊湊且強大的視覺語言模型,結合了原生分辨率ViT編碼器、MLP投影器和MiMo-7B語言模型,在多模態推理等任務中表現出色。該模型在多個基準測試中表現優異,具備思維控制功能,用戶體驗顯著提升。
MiMo-VL是一款緊湊且強大的視覺語言模型,結合了原生分辨率ViT編碼器、MLP投影儀和專為複雜推理任務優化的MiMo-7B語言模型。通過多階段預訓練和後訓練,在多個視覺語言任務中取得了優異的成績。
MiMo是一系列專為推理任務從頭訓練的7B參數模型,通過優化預訓練和後訓練策略,在數學和代碼推理任務上表現出色。
MiMo-7B 是小米推出的專為推理任務設計的語言模型系列,包括基礎模型、SFT模型和RL模型,在數學和代碼推理任務上表現優異。
MiMo-7B-RL是基於MiMo-7B-SFT模型訓練的強化學習模型,在數學與代碼推理任務上表現出色,性能媲美OpenAI o1-mini。
小米推出的7B參數規模推理專用語言模型系列,通過優化預訓練和後訓練策略顯著提升數學與代碼推理能力
MiMo-7B-RL是基於MiMo-7B-SFT模型訓練的強化學習模型,在數學與代碼推理任務上達到與OpenAI o1-mini比肩的性能。