AccVideo:突破视频生成瓶颈,实现8.5倍速度提升与高质量输出

AI快讯2个月前发布 niko
2 0
AiPPT - 一键生成ppt

AccVideo:打破视频生成速度与质量瓶颈

在人工智能视频生成范畴,扩散模型虽性能卓越,但迭代去噪特性致使生成耗时且计算成本高,成为广泛应用的阻碍。近日,北京航空大学、香港大学和上海人工智能实验室联合推出创新技术AccVideo。

现有视频扩散模型生成高质量视频表现佳,可迭代去噪过程需大量推理步骤,耗费用户时间且对计算资源要求高,限制了实际应用。研究人员一直探寻加速方法,AccVideo的诞生带来新思路。

AccVideo核心优势:合成数据助力与高效指导并行

AccVideo的关键在于创新蒸馏方法,借助合成数据集加速视频扩散模型。研究团队先用预训练模型生成去噪轨迹,构建高质量合成数据集,该方法避免冗余数据点,提升蒸馏效率。

同时,AccVideo设计基于轨迹的少步指导策略,利用合成数据关键数据点,让“学生”模型在更少步骤内学习“教师”模型去噪过程,实现快速视频生成。

兼顾质量与效率:对抗训练提升视频品质

为挖掘合成数据集信息,AccVideo引入对抗性训练策略,有效对齐学生模型输出分布与合成数据集分布,显著提升生成视频质量。

实验显示,AccVideo在保持性能的同时,生成速度提升8.5倍,还能生成5秒、分辨率720×1280、帧率24fps的高质量视频,相比以往加速方法优势明显。

广阔应用前景:高质量长视频生成不再困难

AccVideo的突破为高质量视频生成带来新机遇。其高效生成能力、出色视频质量和分辨率,在文本到视频生成领域潜力无限。用户通过文本描述,能快速生成优质视频,拓展创作可能性。

从定性结果看,AccVideo能高质量呈现复杂场景和多样主题。其发布是视频生成领域重要里程碑,8.5倍加速效果和高质量输出,解决现有难题,为视频创作和应用奠定基础。项目链接:https://top.aibase.com/tool/accvideo

© 版权声明
Trea - 国内首个原生AI IDE