硅基流動上線螞蟻百靈團隊 Ling-flash-2.0,推理速度再創新高
近日,硅基流動大模型服務平臺正式上線了螞蟻集團百靈團隊最新開源的 Ling-flash-2.0,這是該平臺上線的第130個模型。Ling-flash-2.0是一款基於 MoE 架構的大型語言模型,擁有100億參數,並且在激活時僅使用6.1億參數(非嵌入激活4.8億)。經過20TB 以上高質量語料的預訓練、監督微調和多階段強化學習,該模型在激活6億以上參數的情況下,展現出了媲美40億參數 Dense 模型的卓越性能。Ling-flash-2.0在複雜推理、代碼生成和前端研發等領域表現出色,能夠支持最大128K 的上下文長度,給用戶提供更