階躍星辰最新一代基礎大模型 Step 3 正式開源
階躍星辰團隊宣佈其最新一代基礎大模型 Step3正式開源。Step3是一款專爲追求性能與成本極致均衡的企業和開發者設計的模型,旨在面向推理時代打造最適合應用的模型。該模型的開源地址包括 Github、Hugging Face 和魔搭 ModelScope,開發者可以自由下載體驗。
Step3採用 MoE 架構,總參數量達到3210億,激活參數量爲380億。它不僅擁有強大的視覺感知和複雜推理能力,還能準確完成跨領域的複雜知識理解、數學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。通過 MFA(Multi-matrix Factorization Attention)和 AFD(Attention-FFN Disaggregation)的優化,Step3在各類芯片上的推理效率均大幅提升。此外,面向 AFD 場景的 StepMesh 通信庫也已隨模型一同開源,提供可跨硬件的標準部署接口,支持關鍵性能在實際服務中的穩定復現。