Diffusion-Vas:追踪视频目标,可补全遮挡部分
在视频分析领域,物体的持久性是人类理解物体即使在完全遮挡情况下依然存在的重要线索。然而,目前的物体分割方法大多只关注可见(模态)物体,而缺乏对无模态(可见 + 不可见)物体的处理。针对这一问题,研究人员提出了一种基于扩散先验的两阶段方法Diffusion-Vas,旨在提升视频无模态分割和内容补全的效果,能追踪视频中的指定目标,然后利用扩散模型补全被遮挡的部分。该方法的第一阶段涉及生成物体的无模态掩码。研究人员通过将可见掩码序列与伪深度图结合,来推断物体边