面壁智能联合清华大学、OpenBMB开源社区,发布并开源了低比特大模型训练成果BitCPM-CANN,在华为昇腾平台原生完成。该成果包含0.5B至8B四个模型尺寸,性能优异,能释放六倍显存红利,显著推动端侧AI大模型的轻量化与工程落地。
面壁智能联合清华大学及OpenBMB开源社区,发布并开源了中国首个基于华为昇腾平台训练的三值(1.58-bit)大模型BitCPM-CANN。该模型在低比特训练领域取得突破,实现从量化算子到训练算法的全链路原生开发,推出0.5B至8B四个尺寸版本,展示了国产算力平台的强大实力。
科大讯飞发布星火X2-Flash模型,采用MoE架构,总参数量30B,支持256K超长上下文,完全基于华为昇腾910B集群训练,标志着国产算力生态下大模型应用进入新效能阶段。
MiniMax开源其自我迭代模型M2.7,华为昇腾AI同日宣布完成0Day适配,开发者可在昇腾Atlas系列产品上无缝部署。该模型核心突破在于其智能体能力,通过将早期版本引导为研究型Agent,使模型具备自我进化与迭代循环功能。
Tencent
-
Input tokens/M
Output tokens/M
Context Length
Stepfun
$100
imone
盘古α是由鹏城实验室联合技术团队研发的26亿参数中文预训练语言模型,基于2048颗昇腾处理器训练完成,具备强大的文本生成能力。