阶跃星辰最新一代基础大模型 Step 3 正式开源
阶跃星辰团队宣布其最新一代基础大模型 Step3正式开源。Step3是一款专为追求性能与成本极致均衡的企业和开发者设计的模型,旨在面向推理时代打造最适合应用的模型。该模型的开源地址包括 Github、Hugging Face 和魔搭 ModelScope,开发者可以自由下载体验。
Step3采用 MoE 架构,总参数量达到3210亿,激活参数量为380亿。它不仅拥有强大的视觉感知和复杂推理能力,还能准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。通过 MFA(Multi-matrix Factorization Attention)和 AFD(Attention-FFN Disaggregation)的优化,Step3在各类芯片上的推理效率均大幅提升。此外,面向 AFD 场景的 StepMesh 通信库也已随模型一同开源,提供可跨硬件的标准部署接口,支持关键性能在实际服务中的稳定复现。