Workflow
终身行人重识别
icon
搜索文档
IEEE TPAMI 2025 | 北京大学提出分布驱动的终身学习范式,用结构建模解决灾难性遗忘
机器之心· 2025-09-26 18:35
研究背景与问题定义 - 行人重识别技术旨在跨摄像头、地点和时间匹配同一行人的图像,在智能安防、交通管理等领域有重要应用价值 [3] - 现实环境中数据分布会随采集条件变化而发生迁移,导致测试数据与训练数据间存在显著域偏移,传统静态训练范式在动态环境中适应性不足 [3] - 终身行人重识别任务要求模型在持续接收新数据时能增量学习新知识,同时保持对旧知识的辨识能力,核心挑战是灾难性遗忘问题 [3][5] 现有方法局限性 - 保留历史样本的方法存在数据隐私风险和存储开销持续增长的问题 [5] - 知识蒸馏方法因强制新旧模型输出一致性,制约了模型可塑性并限制新知识学习能力 [5] - 现有原型学习方法仅为每个类别保留单一特征中心,忽略了类内分布差异,导致行人的细粒度知识丢失 [5] 核心技术方案 - 提出实例级细粒度建模,动态捕捉行人实例的局部细节信息,为细粒度匹配奠定基础 [14] - 设计分布感知的原型生成算法,将实例级分布信息聚合为更鲁棒的类别级分布原型,克服单一特征中心的局限性 [14] - 引入输入端分布建模机制弥合新旧数据特征分布鸿沟,提升模型对历史知识的利用能力 [14] - 提出基于原型的知识迁移模块,利用分布原型和有标注的新数据协同指导模型学习 [14] 实验性能表现 - 在两种不同域顺序设定下,DKP++的已知域平均性能相比现有方法提升5.2%-7% [17] - DKP++在未知域的整体泛化性能相比现有方法提升4.5%-7.7% [17] - 随着已学习域数量增加,DKP++呈现更高的历史知识巩固能力和未知域泛化性能增长速度 [20] - 在以不同的重识别基础模型作为预训练模型时,DKP++均保持了对现有方法的优势 [21] 技术创新与未来方向 - 提出基于实例级分布建模构建分布原型,增强了模型对历史信息的表达能力 [23] - 通过域分布建模与样本分布对齐克服新旧域数据的分布鸿沟 [23] - 未来可基于Diffusion等架构促进分布对齐以进一步提升抗遗忘能力 [23] - 构建模型的主动遗忘机制对进一步增强模型的知识巩固和学习能力具有重要研究价值 [23] - 增强模型的多模态数据持续学习能力可促进复杂环境的感知能力 [23]
IEEE TPAMI 2025 | 北京大学提出LSTKC++,长短期知识解耦与巩固驱动的终身行人重识别
机器之心· 2025-07-03 08:22
研究背景与动机 - 北京大学团队在IEEE TPAMI发布LSTKC++框架研究成果,引入长短期知识解耦与动态纠正融合机制,解决终身学习中的新知识学习与历史知识记忆问题[1][2] - 行人重识别技术面临实际应用中数据分布动态变化的挑战,传统静态推理范式难以适应,催生终身行人重识别任务需求[4][5][6] - LReID核心挑战是灾难性遗忘问题,现有知识蒸馏方法存在错误知识迁移和知识损失两大隐患[9][12] 框架设计 基础框架LSTKC - 采用短期-长期模型协同融合思想,划分短期模型(特定域)和长期模型(历史域知识)[11] - 引入R-STKT模块纠正长期模型中的错误特征并迁移正确知识[13] - 通过E-LTKC模块实现长短期知识自适应融合,平衡新旧知识[14] 升级框架LSTKC++ - 模型解耦:将长期旧模型拆分为更早期知识模型和近期知识模型[19] - 长短期互补知识迁移:基于样本亲和度矩阵筛选纠正知识,融合正确知识并纠正错误知识[19] - 知识权衡参数优化:利用新增域数据作为验证集搜索最优参数,避免过拟合[19][20] - 样本关系引导的长期知识巩固:基于相似性矩阵计算融合权重实现知识整合[20][22] 实验验证 - 性能优势:在两种域顺序设定下,Seen-Avg mAP/R@1指标比DKP方法提升1.5%-3.4%,Unseen-Avg指标提升1.3%-4%[25] - 域适应能力:中间三个域性能显著优于现有方法,体现遗忘-学习平衡优势[25] - 效率优势:参数量最少,训练时间、显存占用(仅增加818MB/7.4%)显著低于DKP等对比方法[25] 技术创新与应用 - 四大创新设计:解耦式知识记忆体系、语义级知识纠错、长短期互补知识提炼、遗忘-学习主动权衡[26] - 三大应用场景:动态开放环境适应(智慧城市/安防)、隐私保护需求满足(医疗/交通)、高效学习部署(边缘设备)[27] - 未来方向:预训练大模型拓展、多模态感知机制研究、通用类别域增量识别推广[28]