异常生成
搜索文档
UofT、UBC、MIT和复旦等联合发布:扩散模型驱动的异常检测与生成全面综述
机器之心· 2025-07-01 07:48
扩散模型在异常检测领域的综述研究 - 一篇题为“Anomaly Detection and Generation with Diffusion Models: A Survey”的综述文章首次系统性地聚焦于扩散模型在异常检测与生成领域的应用,梳理了图像、视频、时间序列、表格和多模态异常检测任务的最新进展[1] 扩散模型的技术优势 - 扩散模型通过正向扩散与反向去噪的马尔可夫过程实现数据分布建模,其生成机制在捕捉复杂数据分布的细微差异上具有显著优势[5] - 与传统的GANs、VAE和Transformer等无监督异常检测方法相比,扩散模型在生成样本的质量和多样性方面表现出色,在异常检测领域展示出出色潜力[5] 异常检测的核心评分范式 - 基于重构评分的异常检测方法通过扩散模型反向去噪过程重构输入样本,以重构误差作为异常分数,正常样本重构误差小,异常样本重构误差显著增大[7][8] - 基于密度的评分方法利用扩散模型对数据概率密度的估计能力,将负对数似然作为异常分数,正常样本对应高概率密度,异常样本位于低概率区域[7][9] - 基于分数的评分方法利用数据分布的梯度信息量化样本与数据流形的偏离程度,正常样本梯度范数小,异常样本梯度范数显著增大[7][10] - 三种方法从不同维度刻画异常:重构评分基于样本空间距离,密度评分基于概率分布似然,分数评分基于流形几何梯度[11] 图像异常检测的技术进展 - 在图像异常检测领域,扩散模型面临“恒等快捷方式”问题与高昂的计算成本两大核心挑战[13] - 通过掩码重构、潜空间特征编辑或对抗性训练来打破“恒等快捷方式”,同时采用模型蒸馏、高效ODE求解器、潜空间扩散以及模型稀疏化等多种加速策略应对计算效率问题[13] 视频异常检测的技术进展 - 视频异常检测的核心在于处理时序维度和复杂的运动模式,先进的扩散模型通过引入光流、运动矢量或集成时空Transformer架构,将运动信息显式地融入到生成过程中[15] - 这种设计使模型能够学习正常事件的时空演化规律,从而敏锐地捕捉到速度、方向或加速度上的异常变化[15] 时间序列异常检测的技术进展 - 时间序列异常检测领域存在基于重构与基于插补两大主流范式,基于重构的方法利用扩散模型强大的生成能力来复原输入的时间序列,基于插补的方法将异常检测任务转化为缺失值填补问题[17][18] - 这些模型通常会集成循环神经网络或注意力机制,以增强对长短期依赖关系的建模能力[18] 表格异常检测的技术进展 - 表格异常检测面临混合数据类型和普遍缺失值的挑战,扩散模型方法通常通过专门的嵌入层将异构数据统一到连续的表征空间,随后经过改造的扩散模型在这一空间中学习正常数据的联合分布[20] - 针对缺失值问题,一些方法在训练中引入掩码机制,使模型学会在存在数据缺失的情况下进行稳健的推理[20] 多模态异常检测的技术进展 - 多模态异常检测通过融合来自不同数据源的互补信息提升检测准确性,主流融合策略包括早期融合在输入层合并特征、晚期融合在决策层结合各模态输出、动态融合自适应调整各模态权重[23] - 协同扩散等先进框架通过构建共享的嵌入空间和动态融合模块,有效解决了模态对齐和信息不均衡的问题[23] 异常生成的技术进展 - 异常生成技术以正常数据为“种子”,通过引入文本描述、掩码或在潜空间进行特定操作等条件化引导,精确控制生成异常的类型、位置和严重程度[25] - 生成的异常数据可用于扩充训练集增强检测模型泛化能力,作为“陪练”评估提升模型鲁棒性,为自监督学习提供训练信号[26] 技术挑战与未来机遇 - 当前技术瓶颈包括扩散过程的多步计算开销、小样本场景的泛化能力不足、理论解释的缺失等[29][32] - 未来研究方向包括优化扩散模型架构算法提高计算效率、增强对复杂场景的理解适应能力、探索与大语言模型融合实现上下文感知检测、基于元学习的快速领域适应等[29][32]