美團推出2026年“LongCat大模型北斗實習計劃”,面向全球高校碩博生招募大模型領域實習生。該計劃依託美團LongCat團隊,聚焦AGI研發,覆蓋基座模型算法、Infra架構、Agent應用及視覺生成等方向。團隊強調技術落地真實場景,其開源模型矩陣已實現全模態覆蓋,包括560B參數的混合專家模型LongCat-Flash-Chat等。
2026年3月24日,美團龍貓團隊開源了深度學習模型LongCat-Flash-Prover,專門用於數學形式化與定理證明。該模型將形式化推理拆解爲自動形式化、草稿生成與證明生成三大原子能力,旨在克服大語言模型在嚴密邏輯推演中的短板,實現從“概率預測答案”到“嚴謹邏輯證明”的範式轉變。
美團開源了擁有5677億參數的數學證明模型LongCat-Flash-Prover,採用MoE架構,針對複雜數學形式化證明優化,在頂級基準測試中展現出卓越的邏輯推理能力。
美團LongCat團隊發佈新模型LongCat-Flash-Lite,採用“嵌入擴展”新範式,突破傳統MoE架構瓶頸。研究表明,擴展嵌入層比單純增加專家數量能獲得更優的帕累託前沿,有效解決了邊際收益遞減和通信開銷高的問題。
mlx-community
這是美團LongCat-Flash-Chat模型的MLX格式轉換版本,採用創新的DQ6_K_M量化技術,專為配備512GB內存的蘋果Mac Studio M3 Ultra設備優化,在保持接近8位量化性能的同時顯著減少內存佔用