Workflow
自动驾驶停车
icon
搜索文档
博世Dino-Diffusion:端到端泊车无惧天气影响,解决跨域鸿沟
自动驾驶之心· 2025-10-29 08:04
文章核心观点 - 提出一种名为Dino-Diffusion Parking(DDP)的模块化自动驾驶停车系统,该系统结合视觉基础模型(DINOv2)与扩散模型进行轨迹建模,旨在解决端到端停车模型因天气等视觉变化导致的跨域失效问题 [8] - 该系统在CARLA跨域基准测试中显著优于现有方法,并在3D高斯喷溅(3DGS)环境中验证了其从仿真到现实的迁移潜力,成功率稳超90% [8][33] 自动驾驶停车领域现状与挑战 - 全球近60%的新车已配备某种形式的自动驾驶功能,但停车相关事故占美国所有车辆事故的20%,其中91%发生在倒车过程中,凸显精确感知、规划和控制的重要性 [6] - 自动停车面临空间受限、频繁转向、低速复杂路径规划等独特挑战 [6] - 端到端方法对训练与测试分布的一致性要求高,视觉变化(如天气、光照)会导致策略失效,在跨域迁移时表现不佳 [6] Dino-Diffusion Parking系统方法 - 系统采用模块化、级联设计,解耦感知、规划与控制,避免过拟合 [8][10] - 使用预训练的DINOv2模型提取图像特征并转换为鸟瞰图表示,利用其强大的跨域泛化能力为规划提供稳定输入 [9] - 提出后见目标重标注策略,在训练中对目标位姿进行扰动并重新生成分割图,以提升模型对目标位姿的鲁棒性 [12] - 使用FiLM结构将目标位姿信息融合到BEV特征中,避免梯度传播不稳定 [13] - 将轨迹规划建模为扩散过程,在SE(2)空间中建模以降低误差累积,并使用Stanley控制器进行精准轨迹跟踪 [14][15][18] 实验验证与结果 - 在CARLA模拟器中训练,使用800条专家轨迹,测试环境包括与训练环境一致、轻度域偏移(如云层、降水)和重度域偏移(如低光照、大雾)三种天气设置 [20][21] - DINOv2提取的特征在不同域下保持一致,而传统模型(如EfficientNet)对视觉变化敏感,定量结果显示该方法在多个特征层上误差显著降低 [23] - 通过引入重标注数据,模型能稳定识别目标车位,在视觉变化下保持一致性 [26] - 扩散模型与Stanley控制器结合,在大域偏移下成功率提升16%,轨迹误差更小 [27] - 在由真实停车场重建的3DGS环境中进行零样本测试,系统能部分成功完成停车任务,展现出一定的仿真到现实迁移能力 [31] 未来工作方向 - 引入视频世界模型进一步缩小仿真与现实的差距 [35] - 在3DGS环境中收集人类演示数据进行训练 [35] - 在真实车辆上部署系统,验证其在多样化场景下的表现 [35]