Workflow
人脸防伪检测
icon
搜索文档
多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025
量子位· 2025-04-21 21:23
skjack 投稿 量子位 | 公众号 QbitAI 近年来,人脸合成技术在快速发展,相关检测任务也逐渐从"看得出来"向"说明白为什么"演进。除了判断一张脸是真还是假,更需要模型能"说 出个所以然"。 在CVPR 2025的工作《Towards General Visual-Linguistic Face Forgery Detection》中,研究团队尝试从 视觉+语言的多模态视角 来改 进伪造检测方法。 但问题也随之而来—— 数据从哪里来? 多模态任务的关键是高质量标注数据。而伪造检测任务相比于传统的图文匹配,难度在于: 目前社区主流的做法大概有两类: 但实验发现,两种方式都存在较明显的问题,尤其在高质量伪造图像中,容易出现"看花眼"的情况——模型或者标注人可能会误判没有问题的 区域,产生所谓的"语言幻觉"。 本文提出了一种简单有效的训练范式,并围绕数据标注问题,构建了一个高质量的文本生成流程。 为什么要引入语言模态? 在伪造检测任务中加入语言,有两个直接的好处: 因此,团队提出了如图所示的一个新的多模态训练框架: △ 图1:视觉语言伪造检测训练范式 该方法的关键在于:不再直接用图像做二分类判断,而是 先 ...