谷歌 DeepMind 今日宣布为其领先的 AI 视频生成模型 Veo 引入革命性的“精确编辑”功能。该功能允许用户通过简单文本提示轻松向现有视频中添加或删除元素,如道具、角色或背景物体,同时智能重建场景以确保物理真实性和视觉连贯性,完美保留原始视频的完整性。
据 AIbase 报道,此次更新标志着 AI 视频编辑从粗放式生成向精细化后处理转型,将极大提升创作者在 Flow 平台上的生产效率。 Veo 的精确编辑功能是 Veo3.1升级的一部分,专为谷歌的 AI 电影制作工具 Flow 设计。它利用先进的生成式 AI 算法,考虑光影、比例、物体交互和运动轨迹,实现无缝修改。
例如,用户可以指示“向场景中添加一辆黄色校车”或“移除路边的行人”,模型将自动填充背景、调整阴影并维持相机运动的一致性,避免传统编辑软件中常见的“跳帧”或不自然痕迹。在演示视频中,该功能展示了从静态图像到动态多镜头叙事的完整流程,用户仅需几秒钟即可迭代内容,而无需重新拍摄或手动蒙版。
据 AIbase 分析,Veo3.1的核心创新包括增强的音频同步、多提示场景生成和原生1080p 输出,支持视频长度扩展至1分钟。这使得精确编辑不仅适用于短片创作者,还能服务于广告、营销和企业培训场景。例如,在 Flow 中,用户可上传“成分”(如预定义角色或风格参考),然后通过精确编辑扩展镜头,实现从单帧到完整故事板的自动化。相比前代 Veo3,该版本在角色一致性和叙事控制上提升了30% 以上,基准测试显示编辑准确率达95%,显著优于竞争对手如 OpenAI 的 Sora2。 “精确编辑让 AI 视频创作真正民主化,用户无需专业技能即可实现好莱坞级别的修改,”
DeepMind 在官方博客中表示,该功能已集成至 Flow 的实验性工具中,支持 Google AI Pro 和 Ultra 订阅用户优先访问。开发者可通过 Vertex AI 平台预览企业级应用,包括自定义语音和物体移除优化。此前 Veo 已在 Imagen3和 Chirp3模型中展现出类似 inpainting 能力,推动视频 AI 从实验阶段向生产就绪转型。 随着内容创作者对高效工具的需求激增,Veo 的精确编辑有望重塑数字叙事生态,从独立电影到社交媒体短视频均受益匪浅。