比原声还原生!字节新项目Loopy让数字人声音完美匹配画面 该死的割裂感终于消失了
LOOPY技术,由字节跳动与浙江大学联合研发,是一种基于音频驱动的视频扩散模型,旨在解决虚拟形象生成时声音与画面割裂的问题。该技术仅需一帧图像和音频输入,就能生成逼真、动态且符合音频节奏与情感的虚拟形象动作,包括非语音动作、情绪驱动的眉毛和眼睛运动以及自然的头部运动。LOOPY的核心是其独特的长期运动信息捕捉模块,支持多种视觉和音频风格,为虚拟形象的动态效果注入了前所未有的活力。该技术不仅在自然度上超越现有模型,在处理侧面肖像时也表现出色,为游戏、电影制作、虚拟现实等领域提供了更高质量、高真实度的虚拟形象生成,极大提升了用户体验。LOOPY的灵活性和表现力,为创作者提供了无限的想象空间,预示着虚拟形象技术发展的新标杆。