騰訊混元發佈圖生視頻模型HunyuanVideo-I2V,並上線對口型等玩法
騰訊宣佈開源其新研發的圖像轉視頻生成框架 ——HunyuanVideo-I2V。該模型的發佈是在其成功開源 HunyuanVideo 之後的又一重要進展,旨在推動開放源代碼社區的深入探索。HunyuanVideo-I2V 結合了先進的視頻生成技術,能夠將靜態圖像轉換爲生動的視頻內容,爲創作者提供了更多的可能性。HunyuanVideo-I2V 利用了一個預訓練的多模態大語言模型作爲文本編碼器,顯著增強了模型對輸入圖像語義內容的理解能力。這意味着,用戶輸入的圖像能夠通過模型生成語義圖像標記,這些標記與視頻潛在標記相結