美团LongCat团队开源了最新AI模型LongCat-Flash-Thinking-2601,该模型在智能体搜索、工具调用及推理等多项核心评测中达到开源模型最高水平。其核心优势在于卓越的工具调用能力,能有效处理依赖工具的复杂任务,显著降低真实场景中对新工具的适应成本。
美团LongCat团队开源视频生成模型LongCat-Video-Avatar,推动虚拟人技术发展。该模型在长视频生成领域表现突出,基于LongCat-Video升级,支持音频文本转视频、音频文本图像转视频及视频续写等多任务功能,受到开发者广泛关注。
美团LongCat团队开源了LongCat-Image图像生成模型,该模型拥有6B参数,在文生图和图像编辑领域表现优异,旨在平衡性能与使用门槛,填补开源与闭源模型之间的技术空白。
美团发布WOWService大模型交互系统技术报告,针对本地生活服务领域,解决通用能力与行业需求不匹配、复杂场景下服务可靠性与个性化难兼顾、数据成本高及训练周期长等落地难题,并弥补可复用业务框架和真实场景优化方案的行业空白。
meituan-longcat
长猫图像编辑是长猫图像(Longcat-Image)的图像编辑版本,是一个支持中英双语的开源图像编辑模型。它在指令遵循、图像质量和视觉一致性方面达到了开源模型的先进水平,具备出色的精准编辑能力和一致性保留能力。
LongCat-Video是一款具有136亿参数的基础视频生成模型,在文本到视频、图像到视频和视频续帧等生成任务中表现出色,尤其擅长高效、高质量的长视频生成。
mlx-community
这是美团LongCat-Flash-Chat模型的MLX格式转换版本,采用创新的DQ6_K_M量化技术,专为配备512GB内存的苹果Mac Studio M3 Ultra设备优化,在保持接近8位量化性能的同时显著减少内存占用