美团LongCat团队开源视频生成模型LongCat-Video-Avatar,推动虚拟人技术发展。该模型在长视频生成领域表现突出,基于LongCat-Video升级,支持音频文本转视频、音频文本图像转视频及视频续写等多任务功能,受到开发者广泛关注。
美团发布视频生成模型LongCat-Video,推动AI理解真实世界。该模型基于DiT架构,能模拟物理规律,处理文本生成视频等任务,助力世界模型研究发展。
美团LongCat团队发布视频生成模型LongCat-Video,基于DiT架构,能精准重构真实世界动态,支持文生视频、图生视频和视频续写功能。这标志着美团在世界模型领域取得重要进展,该模型是下一代AI核心引擎,助力AI更好地理解和预测现实世界。
meituan-longcat
LongCat-Video是一款具有136亿参数的基础视频生成模型,在文本到视频、图像到视频和视频续帧等生成任务中表现出色,尤其擅长高效、高质量的长视频生成。