螞蟻集團開源百靈大模型Ring-flash-linear-2.0-128K,專攻超長文本編程。採用混合線性注意力與稀疏MoE架構,僅激活6.1B參數即可媲美40B密集模型,在代碼生成和智能代理領域達到最優表現,高效解決長上下文處理痛點。
螞蟻百靈團隊開源兩款高效思考模型Ring-flash-linear-2.0和Ring-mini-linear-2.0,專爲提升深度推理效率設計。同時發佈FP8融合算子和線性Attention推理融合算子,支持“大參數、低激活”的高效推理與超長上下文。通過架構優化與高性能算子協同,實現顯著性能提升。