Workflow
CVPR'25端到端冠军方案!GTRS:可泛化多模态端到端轨迹规划(英伟达&复旦)

端到端自动驾驶挑战赛背景 - NAVSIM v2端到端自动驾驶挑战赛是CVPR 2025 Autonomous Grand Challenge的重要赛事之一,重点评估模型在复杂驾驶情境下的决策鲁棒性与安全性[1] - 测试集包含困难驾驶场景及3D渲染延伸场景,考验模型泛化能力[1] 团队与比赛成绩 - NVIDIA与复旦大学组成的团队获得NAVSIM v2挑战赛冠军[2] - 最终方案EPDMS指标达到49.4,创下当前最先进规划表现[14] 技术方案演进 - 从模仿学习扩散模型转向基于规则的知识蒸馏范式Hydra-MDP[2][4] - Hydra-MDP框架使用多模式轨迹候选与环境交互奖励信号,提升复杂场景决策安全性[4] - 新提出的GTRS框架融合动态生成与静态词表轨迹评分策略[5] GTRS框架核心技术 - 包含三大核心组件:扩散模型轨迹生成器、超密集轨迹词表、传感器视角扰动与精细化评分模块[5] - 动态轨迹生成弥补静态词表多样性不足,带来EPDMS指标+1.1%提升[7] - GTRS-Dense模型采用随机Dropout策略,实现EPDMS+1.4%性能提升[10] - GTRS-Aug模型引入传感器增强与轨迹精细化评分,EPDMS提升+2.8%[12] 模型集成策略 - 融合扩散策略生成的动态轨迹与静态词表轨迹[14] - 联合使用GTRS-Dense和GTRS-Aug等多评分器进行轨迹评估[14] - 集成方案充分发挥各模型在泛化性和鲁棒性方面的互补优势[14]