小巧却强大的推理引擎!Ring-mini-2.0 震撼发布,性能超越10B模型
今天,我们正式推出了 Ring-mini-2.0,这是一款基于 Ling-mini-2.0架构深度优化的高性能推理型 MoE 模型。Ring-mini-2.0的总参数量达到16B,但在实际运行中仅需激活1.4B 参数,便能实现相当于10B 级别以下的密集模型的推理能力。这款模型在逻辑推理、编程和数学任务中表现尤为出色,支持128K 的长上下文,使得其在各种应用场景中都能展现出强大的能力。此外,Ring-mini-2.0的生成速度也相当惊人,能够实现300+ token/s 的快速生成,经过优化后更是可以突破500+ token/s。图源备注:图片由AI生成,图片授权