轨迹生成算法
搜索文档
摸底地平线HSD一段式端到端的方案设计
自动驾驶之心· 2026-01-13 18:14
文章核心观点 - 地平线公司提出的两篇关于一段式端到端自动驾驶方案(HSD)的核心文章,即DiffusionDrive和ResAD,为行业提供了重要的技术思路和启发 [2][3] - DiffusionDrive的核心贡献在于其基于锚点(anchor-based)的轨迹生成方法,旨在降低训练难度并提升推理实时性 [4][8][10] - ResAD的核心贡献在于其残差监督设计,通过预测未来轨迹与惯性外推轨迹之间的残差,使模型更专注于学习驾驶行为的多样性,有效应对数据分布不平衡问题 [11][12][17] DiffusionDrive方案总结 - **整体架构**:方案整体架构可分为三部分:感知信息、导航信息和轨迹生成 [6] - **感知信息**:核心是将感知任务的信息表征传递给规划器,一段式方案可采用稠密(dense)的BEV特征图或稀疏(sparse)的实例特征等不同玩法,通常结合公司现有技术栈适配 [6] - **导航信息**:实践中确保模型遵循正确导航路线极具挑战性,特别是在复杂路况(如上海)下,算法设计需考虑导航平台、信息丰富度及定位能力等多方面因素 [7] - **轨迹生成**:采用“截断扩散”(Truncated Diffusion)方法,基于人类驾驶行为存在固定模式的观察 [8] - 具体流程:1) 从训练集中通过K-Means聚类出N个代表常见驾驶行为的轨迹序列作为锚点;2) 训练时对这些锚点轨迹施加较弱的噪声,从而减少去噪所需的步数;3) 训练时计算与真值轨迹最接近的锚点的去噪轨迹损失,并为每个锚点预测存在性 [9] - **方案优势**:基于锚点的轨迹生成方法能降低训练收敛难度,减少推理时的去噪次数需求,并且可根据算法设计锚点数量以控制推理成本 [8][9][10] - **潜在疑问**:文章未涉及系统时序模块,因此轨迹在时序上的稳定性如何保证存疑 [10] ResAD方案总结 - **核心设计**:方案最有意思的部分是残差设计,模型不直接生成未来轨迹,而是预测未来轨迹与基于惯性外推的未来轨迹之间的残差 [12] - **残差正则化**:由于距离当前时刻越远,残差通常越大,因此需要对时序上的残差进行正则化处理,以压缩其区间 [13] - **设计优势**:残差监督能使不同未来时刻的轨迹分布更一致,这种一致性非常有益:在损失计算上,轨迹预测误差不会被距离自车较远的点过度影响;在学习难度上,模型更不易在数据分布不平衡的情况下“偷懒” [14][17] - **惯性参考扰动**:考虑到残差设计,其生成过程中的噪声扰动方式也不同,噪声直接作用于初始速度,并通过控制横向(lat)和纵向(lon)的噪声大小来调整模型对不同方向的学习难度和关注程度,会设置K种噪声以供推理时按需选择 [15] - **轨迹排序器(Ranker)**:方案提到了轨迹选择器,将top-k的预测轨迹编码作为查询(Q),环境信息(感知和导航信息)作为键(K)和值(V),通过Transformer处理,同时加入自车状态(ego status)的嵌入,来预测多个可自定义的度量分数(metric scores) [16] - **方案评价**:正则化的残差监督令人印象深刻,它将惯性部分从预测中剥离,使模型专注于真正的多样性部分,有效对抗了数据采集(数采)中大量匀速行驶数据导致的不平衡分布问题 [17] - **改进建议**:轨迹排序器部分解答了关于DiffusionDrive轨迹稳定性的疑问,但可以进一步设计为时序模块,以提升选择的稳定性 [17]