最好的text-to-video AI工具模型_精選text-to-video資訊

AI資訊

Veo 2重磅登陸Gemini API：AI視頻生成革命正式啓航

近日，谷歌旗下人工智能團隊宣佈，其備受矚目的視頻生成模型Veo2正式通過Gemini API向開發者開放。這一消息迅速在科技圈掀起熱潮，標誌着AI視頻生成技術邁入了全新的發展階段。據悉，從即日起，凡是啓用計費功能並達到Tier1及以上級別的開發者，均可通過API調用Veo2，體驗其強大的文本到視頻（Text-to-Video）和圖像到視頻(Image-to-Video)生成能力。這一舉措不僅爲開發者提供了尖端工具，也爲AI驅動的創意產業注入了新的活力。Veo2作爲谷歌DeepMind團隊的最新力作，以其高保真視頻生成能力和

18.4k 前天

字節聯合高校出品！STAR 模型：提升視頻清晰度和分辨率

近日，南京大學的研究團隊與字節跳動、西南大學聯合推出了一項創新技術 ——STAR（Spatial-Temporal Augmentation with Text-to-Video Models），旨在利用文本到視頻模型，實現真實世界視頻的超分辨率處理。該技術結合了時空增強方法，能夠有效提高低分辨率視頻的質量，尤其適用於在視頻分享平臺上下載的低清晰度視頻。爲了方便研究者和開發者使用，研究團隊已經在 GitHub 上發佈了 STAR 模型的預訓練版本，包括 I2VGen-XL 和 CogVideoX-5B 兩種型號，以及相關的推理代碼。這些工具的推出標誌着在視頻處

23.9k 前天