扩散桥隐式模型

搜索文档
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
机器之心· 2025-04-27 18:40
核心观点 - 扩散桥隐式模型(DBIM)是一种新型算法,能够显著加速扩散桥模型的推理过程,无需额外训练 [4] - DBIM通过引入非马尔科夫扩散桥和方差控制参数ρ,实现从随机到确定性采样的灵活切换 [7] - 该方法在图像翻译和图像修复任务中表现出色,仅需20步推理即可超越传统模型118步的效果 [12][13] 方法介绍 - DBIM核心思想是推广扩散桥模型,提出非马尔科夫扩散桥,保持相同边缘分布与训练目标 [7] - 引入方差控制参数ρ,使生成过程可在随机与确定性采样间自由切换 [7] - 导出扩散桥的新常微分方程表达形式,比DDBM更简洁有效 [7] - 提出高阶数值求解方法,提升推理精度与效率 [8] - 采用"启动噪声"机制解决初始奇异性问题,保证生成多样性 [9] 实验结果 - 在Edges→Handbags(64×64)任务中,DBIM 20步推理FID为1.74,优于DDBM 118步的1.83 [12][13] - 在DIODE-Outdoor(256×256)任务中,DBIM 100步推理FID为2.57,优于DDBM 200步的3.34 [12][13] - 在ImageNet 256×256图像修复任务中,DBIM 20步推理FID为4.07,显著优于DDBM 500步的4.27,实现25倍加速 [13][14] - 确定性采样模式在低步数时优势明显,适当增加随机性可提升高步数下的多样性 [16][17] - 高阶采样器能一致提升生成质量,增强图像细节 [18]