小巧卻強大的推理引擎!Ring-mini-2.0 震撼發佈,性能超越10B模型
今天,我們正式推出了 Ring-mini-2.0,這是一款基於 Ling-mini-2.0架構深度優化的高性能推理型 MoE 模型。Ring-mini-2.0的總參數量達到16B,但在實際運行中僅需激活1.4B 參數,便能實現相當於10B 級別以下的密集模型的推理能力。這款模型在邏輯推理、編程和數學任務中表現尤爲出色,支持128K 的長上下文,使得其在各種應用場景中都能展現出強大的能力。此外,Ring-mini-2.0的生成速度也相當驚人,能夠實現300+ token/s 的快速生成,經過優化後更是可以突破500+ token/s。圖源備註:圖片由AI生成,圖片授權