Netflix 发布了 VOID,一个开源 AI 框架,可从视频中移除物体,同时保留逼真的物理互动。Netflix 推出Netflix 发布了 VOID,一个开源 AI 框架,可从视频中移除物体,同时保留逼真的物理互动。Netflix 推出

Netflix 推出 VOID:用于物理一致性视频物体移除的开源框架

2026/04/06 21:34
阅读时长 4 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。
Netflix 推出 VOID,一个用于物理一致性视频对象移除的开源 AI 框架

全球串流服务 Netflix 推出了 VOID,这是一个开源框架,旨在从视频中移除对象的同时保留它们所产生的物理互动,解决了传统修补和对象擦除工具中存在的局限性。

从历史上看,从场景中移除对象一直很简单,但确保环境在之后表现得真实却带来了重大挑战。例如,删除一个拿着吉他的人会让乐器不自然地悬浮着,而从泳池中移除潜水员可能会让水面保持不动。视觉特效团队传统上都是手动纠正这些问题,这是一个耗时的过程,单个场景可能需要数天到数周的时间。

VOID 是 Video Object and Interaction Deletion(视频对象和互动删除)的缩写,旨在解决这些复杂问题。与仅仅填充缺失像素的传统方法不同,该系统预测对象被移除后场景的物理一致性结果。 

它利用多种技术组合来实现这一目标。Google 的 Gemini 分析场景以识别将受删除影响的区域,而 Meta 的 SAM2 则分割要移除的对象。这些输出被编码成一个四值掩码(quadmask),这是一个四值映射,指示哪些区域要擦除、哪些重叠、哪些受到物理影响以及哪些保持不变。然后,基于阿里巴巴 CogVideoX 构建的视频扩散模型以物理上合理的方式重建场景。可选的第二次处理应用光流来纠正初始重建中的任何失真。

在视频制作中展示物理一致性对象移除 

VOID 的演示显示了令人信服的结果:当持有者被移除时气球自然上升,当不相关的积木被删除时积木保持稳定,当人被擦除后泳池表面保持不受影响。在一项有 25 名参与者的人类偏好研究中,VOID 获得了 64.8% 的青睐,超越了领先的商业替代方案 Runway,后者仅获得 18.4%。

此次发布标志着 Netflix Research 首个公开可用的 AI 工具。VOID 采用 Apache 2.0 许可证,可用于商业用途,并托管在 Hugging Face 上。硬件要求目前限制了访问,需要 40GB VRAM GPU 才能运行该模型,但未来的优化和基础设施成本降低可能会扩大可用性。VOID 代表了视频制作技术的转变,从简单的擦除工具转向能够理解和真实重建场景的系统,这一发展对专业工作流程具有重大意义。

这篇文章 Netflix 推出 VOID:用于物理一致性视频对象移除的开源框架 最先出现在 Metaverse Post。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT$30,000 等值 PRL + 15,000 USDT

充值并交易 PRL,即可提升您的奖励!