字節跳動發佈AI視頻編輯器Vidi2,其視頻理解能力超越谷歌Gemini3Pro,成爲頂尖多模態模型。該工具專爲長視頻設計,可處理數小時素材,通過簡單提示詞自動生成腳本、短視頻或完整電影,大幅降低視頻創作門檻。
字節跳動發佈120億參數視頻理解模型Vidi2,能處理數小時原始素材,理解故事脈絡,並根據提示生成TikTok短視頻或電影片段。其核心突破是精細時空定位(STG)功能,可同時識別視頻中的時空細節,有望顛覆視頻編輯行業。