XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款强大的跨具身视觉语言模型,在自动驾驶和具身AI任务中均展现出了卓越的性能。它是首个将这两个关键领域相结合的开源视觉语言模型,显著提升了在动态物理环境中的理解和推理能力。
MiMo Audio是小米开发的音频语言模型,通过大规模预训练展现出强大的少样本学习能力。该模型突破了传统模型依赖特定任务微调的局限,在语音智能、音频理解等任务中表现出色,在开源模型中达到先进水平。
MiMo Audio是一款基于大规模预训练的音频语言模型,在语音智能和音频理解基准测试中取得了开源模型的SOTA性能。该模型展现出强大的少样本学习能力,能够泛化到训练数据中未包含的任务,支持语音转换、风格迁移和语音编辑等多种音频任务。
bartowski
这是XiaomiMiMo的MiMo-VL-7B-SFT-2508模型的量化版本,使用llama.cpp进行优化处理,旨在提升模型在特定硬件上的运行性能。该模型是一个70亿参数的视觉语言模型,支持图像到文本的生成任务。
这是小米MiMo-VL-7B-RL-2508模型的GGUF量化版本,使用llama.cpp的imatrix选项进行量化处理,支持多种量化级别,适用于不同的硬件配置和性能需求。
benxh
这是XiaomiMiMo/MiMo-VL-7B-RL-2508模型的GGUF量化版本,采用Q6_K量化级别。该模型是一个7B参数规模的多模态视觉语言模型,支持图像和文本的联合理解与生成任务。
MiMo-VL是一款紧凑且强大的视觉语言模型,结合了原生分辨率ViT编码器、MLP投影器和MiMo-7B语言模型,在多模态推理等任务中表现出色。该模型在多个基准测试中表现优异,具备思维控制功能,用户体验显著提升。
MiMo-VL是一款紧凑且强大的视觉语言模型,结合了原生分辨率ViT编码器、MLP投影仪和专为复杂推理任务优化的MiMo-7B语言模型。通过多阶段预训练和后训练,在多个视觉语言任务中取得了优异的成绩。
MiMo是一系列专为推理任务从头训练的7B参数模型,通过优化预训练和后训练策略,在数学和代码推理任务上表现出色。
MiMo-7B 是小米推出的专为推理任务设计的语言模型系列,包括基础模型、SFT模型和RL模型,在数学和代码推理任务上表现优异。
MiMo-7B-RL是基于MiMo-7B-SFT模型训练的强化学习模型,在数学与代码推理任务上表现出色,性能媲美OpenAI o1-mini。
小米推出的7B参数规模推理专用语言模型系列,通过优化预训练和后训练策略显著提升数学与代码推理能力
MiMo-7B-RL是基于MiMo-7B-SFT模型训练的强化学习模型,在数学与代码推理任务上达到与OpenAI o1-mini比肩的性能。