阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源
阿里巴巴旗下的通義實驗室在Hugging Face和GitHub平臺正式開源了其最新的Wan2.1-FLF2V-14B首尾幀生視頻模型。這一模型以其支持高清視頻生成和靈活的首尾幀控制功能引發業界熱議,爲AI驅動的視頻創作提供了全新可能。Wan2.1-FLF2V-14B:首尾幀驅動的視頻生成新標杆Wan2.1-FLF2V-14B是阿里通義萬相系列的最新力作,基於數據驅動訓練和**DiT(Diffusion Transformer)**架構,專爲首尾幀視頻生成設計。據社交媒體平臺上的討論,該模型只需用戶提供兩張圖片作爲首幀和尾幀,即可生成一段長約5秒、720p分辨率的