小米MiMo在全球最大AI模型API聚合平台OpenRouter上登顶全球调用量榜首,成为首个获此成就的国产大模型。近一个月,MiMo贡献1.45万亿Token调用量,在300多个模型中脱颖而出。其端云协同架构设计带来高推理效率和低成本,实用性优先的定位获全球开发者认可。生态上,Nous Research已与小米合作,MiMo系列全面接入增长最快的开源生态。
在AI平台OpenRouter最新统计中,开源Agent框架Hermes Agent的调用量全球登顶,日均Token调用量达2910亿,周调用量突破1.75万亿。小米自研的MiMo大模型作为其首选推理引擎,近一个月贡献1.45万亿Token调用量,位居所有支撑模型之首,成为核心推动力。
Hermes Agent 智能体框架由Nous Research开发并开源,自2026年2月发布后迅速崛起,在全球Token消耗量榜单上首次超越OpenClaw登顶首位。该智能体在调用前五大模型方面表现突出,包括小米MiMo-V2-Pro、MiniMax M2.7、英伟达Nemotron 3 Super、阶跃星辰Step 3.5 Flash及腾讯Hy3 preview,展现了其在AI领域的领先地位。
小米发布MiMo-V2.5全链路语音模型系列,包括三款TTS模型和一款开源ASR模型,覆盖语音输入与输出。TTS模型能精准调度情绪、语气和角色身份,让声音可编程、可创作、可复刻,提升人机交互自然度,开启语音智能新纪元。
小米首个推理大模型MiMo开源,专为推理任务设计,性能卓越。
可控角色视频合成技术
DJI 手持稳定设备专属应用,创作无限。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
MiMo Audio是小米开发的音频语言模型,通过大规模预训练展现出强大的少样本学习能力。该模型突破了传统模型依赖特定任务微调的局限,在语音智能、音频理解等任务中表现出色,在开源模型中达到先进水平。
MiMo Audio是一款基于大规模预训练的音频语言模型,在语音智能和音频理解基准测试中取得了开源模型的SOTA性能。该模型展现出强大的少样本学习能力,能够泛化到训练数据中未包含的任务,支持语音转换、风格迁移和语音编辑等多种音频任务。
bartowski
这是XiaomiMiMo的MiMo-VL-7B-SFT-2508模型的量化版本,使用llama.cpp进行优化处理,旨在提升模型在特定硬件上的运行性能。该模型是一个70亿参数的视觉语言模型,支持图像到文本的生成任务。
这是小米MiMo-VL-7B-RL-2508模型的GGUF量化版本,使用llama.cpp的imatrix选项进行量化处理,支持多种量化级别,适用于不同的硬件配置和性能需求。
allura-forge
MiMo是小米专为推理任务从头开始训练的大语言模型系列,通过优化预训练和后训练策略,在数学和代码推理任务上展现出卓越性能。项目开源了7B参数规模的多个版本,包括基础模型、SFT模型和RL模型。
benxh
这是XiaomiMiMo/MiMo-VL-7B-RL-2508模型的GGUF量化版本,采用Q6_K量化级别。该模型是一个7B参数规模的多模态视觉语言模型,支持图像和文本的联合理解与生成任务。
MiMo-VL是一款紧凑且强大的视觉语言模型,结合了原生分辨率ViT编码器、MLP投影器和MiMo-7B语言模型,在多模态推理等任务中表现出色。该模型在多个基准测试中表现优异,具备思维控制功能,用户体验显著提升。
MiMo-VL是一款紧凑且强大的视觉语言模型,结合了原生分辨率ViT编码器、MLP投影仪和专为复杂推理任务优化的MiMo-7B语言模型。通过多阶段预训练和后训练,在多个视觉语言任务中取得了优异的成绩。
MiMo是一系列专为推理任务从头训练的7B参数模型,通过优化预训练和后训练策略,在数学和代码推理任务上表现出色。
MiMo-7B 是小米推出的专为推理任务设计的语言模型系列,包括基础模型、SFT模型和RL模型,在数学和代码推理任务上表现优异。
MiMo-7B-RL是基于MiMo-7B-SFT模型训练的强化学习模型,在数学与代码推理任务上表现出色,性能媲美OpenAI o1-mini。
小米推出的7B参数规模推理专用语言模型系列,通过优化预训练和后训练策略显著提升数学与代码推理能力
MiMo-7B-RL是基于MiMo-7B-SFT模型训练的强化学习模型,在数学与代码推理任务上达到与OpenAI o1-mini比肩的性能。