研究背景与问题定义 - 行人重识别技术旨在跨摄像头、地点和时间匹配同一行人的图像,在智能安防、交通管理等领域有重要应用价值 [3] - 现实环境中数据分布会随采集条件变化而发生迁移,导致测试数据与训练数据间存在显著域偏移,传统静态训练范式在动态环境中适应性不足 [3] - 终身行人重识别任务要求模型在持续接收新数据时能增量学习新知识,同时保持对旧知识的辨识能力,核心挑战是灾难性遗忘问题 [3][5] 现有方法局限性 - 保留历史样本的方法存在数据隐私风险和存储开销持续增长的问题 [5] - 知识蒸馏方法因强制新旧模型输出一致性,制约了模型可塑性并限制新知识学习能力 [5] - 现有原型学习方法仅为每个类别保留单一特征中心,忽略了类内分布差异,导致行人的细粒度知识丢失 [5] 核心技术方案 - 提出实例级细粒度建模,动态捕捉行人实例的局部细节信息,为细粒度匹配奠定基础 [14] - 设计分布感知的原型生成算法,将实例级分布信息聚合为更鲁棒的类别级分布原型,克服单一特征中心的局限性 [14] - 引入输入端分布建模机制弥合新旧数据特征分布鸿沟,提升模型对历史知识的利用能力 [14] - 提出基于原型的知识迁移模块,利用分布原型和有标注的新数据协同指导模型学习 [14] 实验性能表现 - 在两种不同域顺序设定下,DKP++的已知域平均性能相比现有方法提升5.2%-7% [17] - DKP++在未知域的整体泛化性能相比现有方法提升4.5%-7.7% [17] - 随着已学习域数量增加,DKP++呈现更高的历史知识巩固能力和未知域泛化性能增长速度 [20] - 在以不同的重识别基础模型作为预训练模型时,DKP++均保持了对现有方法的优势 [21] 技术创新与未来方向 - 提出基于实例级分布建模构建分布原型,增强了模型对历史信息的表达能力 [23] - 通过域分布建模与样本分布对齐克服新旧域数据的分布鸿沟 [23] - 未来可基于Diffusion等架构促进分布对齐以进一步提升抗遗忘能力 [23] - 构建模型的主动遗忘机制对进一步增强模型的知识巩固和学习能力具有重要研究价值 [23] - 增强模型的多模态数据持续学习能力可促进复杂环境的感知能力 [23]
IEEE TPAMI 2025 | 北京大学提出分布驱动的终身学习范式,用结构建模解决灾难性遗忘
机器之心·2025-09-26 18:35