蚂蚁集团开源百灵大模型Ring-flash-linear-2.0-128K,专攻超长文本编程。采用混合线性注意力与稀疏MoE架构,仅激活6.1B参数即可媲美40B密集模型,在代码生成和智能代理领域达到最优表现,高效解决长上下文处理痛点。
蚂蚁百灵开源高效推理模型Ring-mini-sparse-2.0-exp,基于Ling2.0架构优化长序列解码。创新结合高稀疏比MoE结构与稀疏注意力机制,显著提升复杂长序列推理性能。通过架构与推理框架深度协同优化,有效应对长序列处理挑战。
蚂蚁集团开源万亿参数大模型Ling-1T,采用FP8低精度训练,为当前最大基座模型。该模型由"百灵"团队开发,属于Ling2.0家族,包含Ling、Ring、Ming三大系列。其中Ling系列专注通用任务,强调速度与效率优势。
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多个高难度基准测试中表现优异,具备强大计算能力和资源效率。该模型为开发者提供先进AI工具,助力技术应用创新。