AIBase
Home
AI NEWS
AI Tools
GEO & AEO
MCP
AI Models
AI Marketplace
EN

AI News

View More

MiniMax 大模型“叫错人名” 稀宇科技:特定词元后训练不足导致

稀宇科技技术报告揭示,M2系列模型无法准确输出“马嘉祺”等特定人名,根源在于分词器导致的“词元偏移”问题。模型将名字切分为“马”和“嘉祺”,使得向量空间被挤压,造成识别偏差。这暴露了当前大模型训练中一个普遍但隐蔽的缺陷,影响了特定人名的精确生成。

17.1k 2 days ago
MiniMax 大模型“叫错人名”  稀宇科技:特定词元后训练不足导致

大模型为何“查无此人”?MiniMax 深度复盘“马嘉祺”消失背后的技术真相

MiniMax M2系列模型在输出“马嘉祺”时出现异常,原因是后训练阶段导致低频Token退化。排查发现,分词器将“马嘉祺”切分为[马,嘉祺],“嘉祺”因预训练高频被合并为独立Token(编号190467),但在后续训练中该Token被“挤压”,引发输出错误。官方已发布技术报告,揭示了这一机制。

21.6k 2 days ago
大模型为何“查无此人”?MiniMax 深度复盘“马嘉祺”消失背后的技术真相
AIBase
Empowering the future, your artificial intelligence solution think tank
English简体中文繁體中文にほんご
FirendLinks:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
Business CooperationSite Map