Workflow
对抗攻击
icon
搜索文档
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
量子位· 2025-08-12 17:35
核心观点 - 清华朱军团队提出强化学习驱动的主动防御框架REIN-EAD,模拟人类视觉系统的主动探索与纠错机制,提升对抗场景下的感知鲁棒性 [1][2][3] - REIN-EAD通过多步连续观察和循环预测优化即时准确率与长期预测熵,显著降低未知攻击与自适应攻击的成功率 [4][12][31] - 框架引入基于不确定性的奖励塑形机制和离线对抗补丁近似技术(OAPA),解决传统被动防御方法的局限性 [6][7][30] 技术框架 - **感知-决策-行动一体化**:REIN-EAD由感知模型(生成环境增强表征)和策略模型(生成主动感知动作)组成闭环系统,实现动态环境中的持续观测与理解 [10][12][13] - **累积信息探索算法**:通过多步累积交互目标优化策略,避免贪婪探索的局部最优问题,结合PPO算法实现稳定策略更新 [20][21][23] - **离线对抗补丁近似(OAPA)**:预先计算对抗补丁流形近似,降低3D环境训练开销,提升对未知攻击的泛化能力 [7][30] 实验性能 - **人脸识别任务**:REIN-EAD在CelebA-3D数据集上将自适应攻击成功率降至7.37%(基线EAD为22.11%),标准精度保持89.03% [32][35] - **物体分类任务**:在OmniObject3D数据集上,REIN-EAD对MeshAdv攻击的防御成功率提升至95.66%(未防御组为3.81%),标准精度88.93% [40] - **目标检测任务**:CARLA场景中,REIN-EAD平均精度(AP)达83.15%,对抗条件下AP保持82.12%(未防御组为35.85%) [43] 创新贡献 - **主动防御范式**:首次将强化学习与运动视觉机制结合,通过环境交互构建时间一致性表征,突破静态防御瓶颈 [5][12][49] - **跨任务泛化性**:在安全关键领域(人脸识别、自动驾驶)实现统一防御框架,对像素空间、隐变量空间攻击均有效 [8][31][42] - **工程实用性**:OAPA技术使训练效率提升3倍以上,支持物理引擎(如UE)不可微分环境下的鲁棒训练 [7][18][30]