蘋果推出視頻生成模型STARFlow-V,採用“歸一化流”技術而非主流擴散模型,專注於提升長視頻穩定性。該模型在視覺質量和生成速度上可與擴散模型媲美,輸出分辨率爲640×480像素,幀率爲每秒16幀。
蘋果發佈視頻生成模型STARFlow-V,採用歸一化流技術替代主流擴散模型,旨在提升長視頻生成的穩定性和減少錯誤累積。該技術直接學習數據分佈,簡化生成過程,與Sora等競爭對手形成差異化競爭。