字節跳動發佈120億參數視頻理解模型Vidi2,能處理數小時原始素材,理解故事脈絡,並根據提示生成TikTok短視頻或電影片段。其核心突破是精細時空定位(STG)功能,可同時識別視頻中的時空細節,有望顛覆視頻編輯行業。