誰說視頻只能“一鏡到底”?字節創新技術LCT,讓AI像導演一樣拍攝電影大片!
你是不是已經看慣了那些由AI生成的,雖然逼真但總感覺少了點“味道”的短視頻?現在,一項名爲長上下文調整 (Long Context Tuning, LCT) 的創新技術橫空出世,它讓AI視頻生成模型擁有了執導多鏡頭敘事視頻的能力,如同電影和電視劇那樣,在不同鏡頭之間自由切換,構建出更連貫、更引人入勝的故事場景。過去,頂尖的AI視頻生成模型,比如SoRA,Kling,Gen3,已經能夠創造出長達一分鐘的逼真單鏡頭視頻。但這與真實世界中,由多個鏡頭組成的敘事視頻(比如電影中的一個場景)的需求之