近日,生数科技与清华大学的 TSAIL 实验室共同发布了一个名为 TurboDiffusion 的视频生成加速框架,并将其开源。这个新框架的发布引起了广泛关注,许多人期待它能为视频生成技术带来突破性进展。根据官方介绍,TurboDiffusion 在几乎不影响生成质量的情况下,能够实现最高达200倍的视频生成推理加速。

TurboDiffusion 的核心技术优势在于针对视频生成领域的一个关键瓶颈进行突破。以往的视频扩散模型虽然具有强大的创造能力,但由于计算复杂度高,效率受到限制,因此难以广泛应用。TurboDiffusion 并不是单纯的优化方案,而是通过多项前沿技术的系统组合,从模型计算、注意力机制到推理流程等多个方面实现整体提速。
该框架采用了多项创新技术来实现加速。例如,低比特注意力加速技术 SageAttention,可以在低比特的 Tensor Core 上无损加速注意力计算。稀疏 - 线性注意力加速则使用可训练的稀疏注意力 Sparse-Linear Attention (SLA),最高可以在 SageAttention 的基础上实现17-20倍的注意力稀疏加速。此外,TurboDiffusion 还引入了最新的蒸馏方法 rCM,使得模型仅需3-4步即可生成高质量视频,显著提升了生成速度。
在保持高质量输出的前提下,TurboDiffusion 实现了视频生成速度的大幅提升,使高质量视频生成逐渐逼近实时交互的可行范围。这标志着 AI 视频创作进入 “实时生成” 时代,推动行业从技术探索期向规模化和商业化落地阶段加速迈进。
TurboDiffusion:https://github.com/thu-ml/TurboDiffusion
划重点:
📈 TurboDiffusion 框架在保持生成质量的情况下,实现最高200倍的视频生成加速。
🔍 采用创新技术,如低比特注意力和稀疏注意力,整体提升视频生成效率。
🚀 该框架的开源为视频生成领域的研究与应用提供了新机遇,标志着进入 “实时生成” 时代。





