地平线ResAD:残差学习让自动驾驶决策更接近人类逻辑
自动驾驶之心·2025-11-08 00:04

文章核心观点 - 地平线、华科和武大团队提出的ResAD框架通过归一化残差轨迹建模方法,解决了端到端自动驾驶中直接预测整条轨迹导致的因果混淆和规划困境两大核心问题 [2] - ResAD框架的核心思想是不直接预测整条轨迹,而是先给出一个基于物理的惯性参考线,然后让模型只学习一个调整量(残差),将学习目标从“轨迹是什么”转变为“为什么要调整方向” [2] - 该方法在NAVSIM v1和v2基准测试中均实现了最先进的性能,PDMS达到88.6,EPDMS达到85.5,展现出优秀的可行性与系统可靠性 [38][39] 技术方法创新 - 轨迹残差建模:模型不直接从零开始预测整个未来轨迹,而是学习预测对一个简单的、基于物理的基线(惯性参考轨迹)的必要修正,量化人类驾驶员为导航环境所施加的精确修正 [17][18][19] - 逐点残差归一化:对残差轨迹进行基于分量的标准最小-最大缩放,解决轨迹预测中坐标在时间维度上的尺度差异问题,确保优化过程不被远场误差所主导 [20][22][23] - 惯性参考扰动:通过将随机扰动引入初始速度,生成包含略微变化的惯性参考簇,自然地产生一组多样化且与上下文相关的路径,实现多模态规划 [24][25][26] 性能表现 - 在NAVSIM v1基准测试中,ResAD的PDMS为88.6,其中NC为98.0,DAC为97.3,EP为82.5,在安全性和路线完成效率方面表现优异 [38] - 在更具挑战性的NAVSIM v2基准上,ResAD的EPDMS为85.5,比DiffusionDrive高出1.0,EP得分为88.2(对比87.5),DAC得分为97.2(对比95.9) [39] - 实车测试视频显示,在近20分钟视频中,系统在施工路段借道绕行等复杂情形下均能稳定通过,并能对动态障碍物做出智能响应 [6] 与现有方法对比 - 与传统端到端方法相比,ResAD避免了因果混淆问题(如前车刹车灯亮就刹车但不理解路口变红灯)和规划困境(过度关注不确定的远期预测) [5] - 与依赖静态预定义轨迹词库的多模态规划方法(如DiffusionDrive)不同,ResAD通过扰动惯性参考直接从高斯噪声中去噪,产生更优的、与上下文相关的多模态轨迹 [10][41] - 消融研究表明,轨迹残差建模将DAC指标从94.3提高到96.6,EP从77.8提高到80.3;结合PRNorm和惯性参考扰动后,PDMS分数从87.2提高到88.6 [43]