AI生成图像检测泛化问题
搜索文档
AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头
量子位· 2025-11-30 13:09
文章核心观点 - 腾讯优图实验室联合高校提出DDA方法,系统性解决AI生成图像检测器在跨模型、跨数据域场景下泛化性能大幅下降的问题 [1] - 该方法从数据层面入手,通过双重数据对齐消除训练数据中的系统性偏差特征,迫使模型学习区分真假的本质特征,而非依赖格式、压缩痕迹等“捷径” [7][14] - 在严格的通用模型评测标准下,DDA方法在11个基准测试中的10个取得领先,并在关键的安全下限指标上显著优于其他方法 [15][16][17][18] 问题根源分析 - AI图像检测器泛化能力差的根源在于训练数据构造方式,导致模型学习的是与真伪无关的“偏差特征”而非本质特征 [3] - 偏差特征包括格式偏差、语义偏差和尺寸偏差,例如模型可能学习“PNG≈假图,JPEG≈真图”的投机策略 [4][5] - 这种策略在标准测试集上准确率可达100%,但对AI生成的PNG图像进行简单JPEG压缩后,检测器性能会出现断崖式下跌 [4] 双重数据对齐方法 - **像素域对齐**:使用VAE技术对真实图像进行重建,得到内容一致、分辨率统一的AI生成图像,消除内容和分辨率偏差 [8] - **频率域对齐**:对重建图执行与真实图相同的JPEG压缩,使两类图像在频率域上对齐,消除因高频信息差异造成的新偏差 [9][12] - **Mixup混合**:将真实图像与经过对齐的生成图像在像素层面进行混合,进一步增强真图和假图的对齐程度 [13] - 经过上述步骤得到在像素和频率特征上都高度一致的“真/假”数据集,促进模型学习更泛化的区分特征 [14] 实验效果与性能 - 提出严格评测准则:只训练一个通用模型,直接在所有未知的、跨域的测试集上评估,更符合真实应用场景 [15] - **综合表现**:在包含11个不同Benchmark的全面测试中,DDA在其中10个上取得领先表现 [18] - **安全下限**:在决定模型最差表现的min-ACC指标上,DDA比第二名高出27.5个百分点 [18] - **真实场景测试**:在高难度真实场景数据集Chameleon上,检测准确率达到82.4% [18] - **跨架构泛化**:学到的本质特征能有效泛化至GAN和自回归模型等完全不同的生成架构 [18]