Workflow
IEEE TPAMI 2025 | 北京大学提出LSTKC++,长短期知识解耦与巩固驱动的终身行人重识别
机器之心·2025-07-03 08:22

研究背景与动机 - 北京大学团队在IEEE TPAMI发布LSTKC++框架研究成果,引入长短期知识解耦与动态纠正融合机制,解决终身学习中的新知识学习与历史知识记忆问题[1][2] - 行人重识别技术面临实际应用中数据分布动态变化的挑战,传统静态推理范式难以适应,催生终身行人重识别任务需求[4][5][6] - LReID核心挑战是灾难性遗忘问题,现有知识蒸馏方法存在错误知识迁移和知识损失两大隐患[9][12] 框架设计 基础框架LSTKC - 采用短期-长期模型协同融合思想,划分短期模型(特定域)和长期模型(历史域知识)[11] - 引入R-STKT模块纠正长期模型中的错误特征并迁移正确知识[13] - 通过E-LTKC模块实现长短期知识自适应融合,平衡新旧知识[14] 升级框架LSTKC++ - 模型解耦:将长期旧模型拆分为更早期知识模型和近期知识模型[19] - 长短期互补知识迁移:基于样本亲和度矩阵筛选纠正知识,融合正确知识并纠正错误知识[19] - 知识权衡参数优化:利用新增域数据作为验证集搜索最优参数,避免过拟合[19][20] - 样本关系引导的长期知识巩固:基于相似性矩阵计算融合权重实现知识整合[20][22] 实验验证 - 性能优势:在两种域顺序设定下,Seen-Avg mAP/R@1指标比DKP方法提升1.5%-3.4%,Unseen-Avg指标提升1.3%-4%[25] - 域适应能力:中间三个域性能显著优于现有方法,体现遗忘-学习平衡优势[25] - 效率优势:参数量最少,训练时间、显存占用(仅增加818MB/7.4%)显著低于DKP等对比方法[25] 技术创新与应用 - 四大创新设计:解耦式知识记忆体系、语义级知识纠错、长短期互补知识提炼、遗忘-学习主动权衡[26] - 三大应用场景:动态开放环境适应(智慧城市/安防)、隐私保护需求满足(医疗/交通)、高效学习部署(边缘设备)[27] - 未来方向:预训练大模型拓展、多模态感知机制研究、通用类别域增量识别推广[28]