字节跳动发布AI视频编辑器Vidi2,其视频理解能力超越谷歌Gemini3Pro,成为顶尖多模态模型。该工具专为长视频设计,可处理数小时素材,通过简单提示词自动生成脚本、短视频或完整电影,大幅降低视频创作门槛。
字节跳动发布120亿参数视频理解模型Vidi2,能处理数小时原始素材,理解故事脉络,并根据提示生成TikTok短视频或电影片段。其核心突破是精细时空定位(STG)功能,可同时识别视频中的时空细节,有望颠覆视频编辑行业。