螞蟻開源輕量級MoE推理模型Ring-lite
近日,螞蟻技術團隊宣佈正式開源其輕量級推理模型Ring-lite。該模型在多項推理榜單上取得了顯著成績,實現了輕量級推理模型的SOTA效果,再次驗證了MoE架構的推理潛力。
Ring-lite以螞蟻技術此前發佈的Ling-lite-1.5爲起點,該模型採用MoE架構,總參數爲16.8B,但激活參數僅2.75B。憑藉獨創的C3PO強化學習訓練方法,Ring-lite在AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等多項推理榜單上表現優異,比肩3倍激活參數大小的10B以下Dense模型。
在技術實現上,Ring-lite團隊進行了多項創新。首創的C3PO強化學習訓練方法有效解決