清华系DeepSeek时刻来了,硅谷沸腾,单卡200倍加速,视频进入秒级时代
Seek .Seek .(US:SKLTY) 36氪·2025-12-23 18:46

核心观点 - 清华大学TSAIL实验室与生数科技联合开源了视频生成加速框架TurboDiffusion,该框架在几乎不影响生成质量的前提下,将AI视频生成速度提升了100-200倍,标志着AI视频生成从“分钟级”进入“秒级”实时时代 [1][3] 技术突破与性能表现 - 该框架是一个专为Diffusion模型加速的工具,尤其擅长处理视频生成场景,在单张RTX 5090消费级显卡上即可实现100-200倍的速度提升 [8] - 实测中,对于1.3B大小的模型生成5秒视频,标准实现需184秒,而TurboDiffusion仅需1.9秒,速度提升约97倍 [10] - 对于14B大小的图生视频模型生成5秒720P视频,标准实现耗时4549秒(超过1小时),TurboDiffusion仅需38秒,速度提升约120倍 [14] - 对于14B大小的文生视频模型生成5秒720P视频,TurboDiffusion在单张RTX 5090上可实现几乎无损的端到端加速200倍 [17] - 在Vidu模型上生成8秒1080P高清视频,原本需要900秒,使用TurboDiffusion后仅需8秒 [21] 核心技术构成 - SageAttention:采用低比特量化注意力加速技术,是全球首个实现注意力计算量化加速的技术方案,已集成至NVIDIA TensorRT等主流GPU平台 [24][25][26] - Sparse-Linear Attention (SLA):引入稀疏注意力加速,可构建在SageAttention之上,显著减少冗余计算,获得数倍的额外加速 [24] - rCM步数蒸馏加速:采用先进的步数蒸馏方法,可将原始Diffusion模型所需的50-100步采样压缩到4-8步,降低延迟而不损失画质 [24][25] - W8A8 INT8量化:在线性层采用INT8量化策略,将模型权重和激活映射到8位整数空间,显著降低推理功耗与内存占用 [25] 行业影响与生态应用 - 该技术已在国内外头部科技企业的核心产品中得到应用,包括腾讯混元、字节豆包、阿里Tora、生数Vidu、智谱清影、百度飞桨、昆仑万维、Google Veo3、商汤、vLLM等 [26] - 该框架的推出被视为视频生成领域的“DeepSeek时刻”,其开源特性(代码与模型全部开源)有望降低AI视频生成的使用门槛,推动其从高门槛专业领域向人人可用的内容创作工具普及 [1][27][29]