美團LongCat團隊發佈新模型LongCat-Flash-Lite,採用“嵌入擴展”新範式,突破傳統MoE架構瓶頸。研究表明,擴展嵌入層比單純增加專家數量能獲得更優的帕累託前沿,有效解決了邊際收益遞減和通信開銷高的問題。
美團LongCat團隊開源了最新AI模型LongCat-Flash-Thinking-2601,該模型在智能體搜索、工具調用及推理等多項核心評測中達到開源模型最高水平。其核心優勢在於卓越的工具調用能力,能有效處理依賴工具的複雜任務,顯著降低真實場景中對新工具的適應成本。
美團開源多模態大模型LongCat-Flash-Omni實現技術突破,在多項基準測試中超越閉源競品,達到業界領先水平。該模型支持文本、語音、圖像、視頻的實時融合處理,具備近乎零延遲的交互能力,將本地化多模態AI應用推向新高度。
美團發佈LongCat-Flash-Omni模型,採用ScMoE技術實現全模態實時交互突破,在多個領域表現優異,開啓人機交互新時代。
mlx-community
這是美團LongCat-Flash-Chat模型的MLX格式轉換版本,採用創新的DQ6_K_M量化技術,專為配備512GB內存的蘋果Mac Studio M3 Ultra設備優化,在保持接近8位量化性能的同時顯著減少內存佔用