稀宇科技技术报告揭示,M2系列模型无法准确输出“马嘉祺”等特定人名,根源在于分词器导致的“词元偏移”问题。模型将名字切分为“马”和“嘉祺”,使得向量空间被挤压,造成识别偏差。这暴露了当前大模型训练中一个普遍但隐蔽的缺陷,影响了特定人名的精确生成。
MiniMax M2系列模型在输出“马嘉祺”时出现异常,原因是后训练阶段导致低频Token退化。排查发现,分词器将“马嘉祺”切分为[马,嘉祺],“嘉祺”因预训练高频被合并为独立Token(编号190467),但在后续训练中该Token被“挤压”,引发输出错误。官方已发布技术报告,揭示了这一机制。
MiniMax开源其自我迭代模型M2.7,华为昇腾AI同日宣布完成0Day适配,开发者可在昇腾Atlas系列产品上无缝部署。该模型核心突破在于其智能体能力,通过将早期版本引导为研究型Agent,使模型具备自我进化与迭代循环功能。
MiniMax 发布 M2.5 模型,这是其 M2 系列在 108 天内的第三次升级。模型开源权重同步上线魔搭 ModelScope,在编程、搜索、办公等多场景表现领先,实现了能力、效率与成本的三重突破。该版本提供从零代码使用到私有化部署的全流程方案,并附有工具调用与推理参数调优的实战指南,旨在推动低成本 Agent 时代的到来。M2.5 在多项评测中成绩突出,例如在 SWE-Bench Verified 中表现亮眼。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
Bytedance
$1.2
$3.6
4