美團LongCat團隊開源視頻生成模型LongCat-Video-Avatar,推動虛擬人技術發展。該模型在長視頻生成領域表現突出,基於LongCat-Video升級,支持音頻文本轉視頻、音頻文本圖像轉視頻及視頻續寫等多任務功能,受到開發者廣泛關注。
美團發佈視頻生成模型LongCat-Video,推動AI理解真實世界。該模型基於DiT架構,能模擬物理規律,處理文本生成視頻等任務,助力世界模型研究發展。
美團LongCat團隊發佈視頻生成模型LongCat-Video,基於DiT架構,能精準重構真實世界動態,支持文生視頻、圖生視頻和視頻續寫功能。這標誌着美團在世界模型領域取得重要進展,該模型是下一代AI核心引擎,助力AI更好地理解和預測現實世界。
meituan-longcat
LongCat-Video是一款具有136億參數的基礎視頻生成模型,在文本到視頻、圖像到視頻和視頻續幀等生成任務中表現出色,尤其擅長高效、高質量的長視頻生成。