字節聯合高校出品!STAR 模型:提升視頻清晰度和分辨率
近日,南京大學的研究團隊與字節跳動、西南大學聯合推出了一項創新技術 ——STAR(Spatial-Temporal Augmentation with Text-to-Video Models),旨在利用文本到視頻模型,實現真實世界視頻的超分辨率處理。該技術結合了時空增強方法,能夠有效提高低分辨率視頻的質量,尤其適用於在視頻分享平臺上下載的低清晰度視頻。爲了方便研究者和開發者使用,研究團隊已經在 GitHub 上發佈了 STAR 模型的預訓練版本,包括 I2VGen-XL 和 CogVideoX-5B 兩種型號,以及相關的推理代碼。這些工具的推出標誌着在視頻處