美团LongCat团队发布新模型LongCat-Flash-Lite,采用“嵌入扩展”新范式,突破传统MoE架构瓶颈。研究表明,扩展嵌入层比单纯增加专家数量能获得更优的帕累托前沿,有效解决了边际收益递减和通信开销高的问题。
美团LongCat团队开源了最新AI模型LongCat-Flash-Thinking-2601,该模型在智能体搜索、工具调用及推理等多项核心评测中达到开源模型最高水平。其核心优势在于卓越的工具调用能力,能有效处理依赖工具的复杂任务,显著降低真实场景中对新工具的适应成本。
美团开源多模态大模型LongCat-Flash-Omni实现技术突破,在多项基准测试中超越闭源竞品,达到业界领先水平。该模型支持文本、语音、图像、视频的实时融合处理,具备近乎零延迟的交互能力,将本地化多模态AI应用推向新高度。
美团发布LongCat-Flash-Omni模型,采用ScMoE技术实现全模态实时交互突破,在多个领域表现优异,开启人机交互新时代。
mlx-community
这是美团LongCat-Flash-Chat模型的MLX格式转换版本,采用创新的DQ6_K_M量化技术,专为配备512GB内存的苹果Mac Studio M3 Ultra设备优化,在保持接近8位量化性能的同时显著减少内存占用