美團全新推理大模型 LongCat-Flash-Thinking發佈
近日,美團宣佈推出一款基於混合專家架構的大型推理模型 ——LongCat-Flash-Thinking。這個新模型的參數量高達5600億,令人矚目!但最令人驚喜的是,它能夠根據上下文需求動態激活186億至313億個參數,平均激活約270億個參數。這種靈活的設計使得模型在多種任務上表現出色,特別是在邏輯推理、數學運算和編程等領域。根據美團的官方數據顯示,LongCat-Flash-Thinking 在一系列基準測試中與其他主流模型進行了深入比較。在數學推理方面,例如 MATH500和 AIME25的測試中,該模型表現不凡,甚至聲稱