Autonomous Driving Planning
搜索文档
扩散规划器全新升级!清华Flow Planner:基于流匹配模型的博弈增强算法(NeurIPS'25)
自动驾驶之心· 2025-10-16 07:33
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 背景介绍 自动驾驶规划 的核心挑战之一在于:如何在多车密集、行为多样的交通场景中,实现安全、可靠、类人的决策。传统基于规则的规划方法依赖人工定义的行为准 则,虽然可解释性强,但在动态、复杂的交通博弈中缺乏泛化能力;而基于学习的规划方法试图直接从海量驾驶数据中学习策略,提升模型的适应性与可扩展性。 然而,当前学习型规划方法仍面临两大核心挑战: 本文希望解决的核心问题是: 能否在不引入额外先验知识的情况下,通过模型自身的学习能力,从有限的数据中提升博弈能力? 自动驾驶决策任务通常被建模为 一个轨迹生成任务,因此,要想生成高质量的轨迹,需要 更加灵活的轨迹建模策略 。同时,博弈场景涉及自车与周围环境的复杂时空交互关系。例如,当车辆需 要在密集车流中变道时,模型必须同时关注当前车道及目标车道中前后方车辆的行为。这要求模型具备高效且自适应的特征整合与处理能力,能够快速识别并聚焦 关键交通参与者的动作与意图。最后,为了能够在与周围交通参与者的博弈过程中作出准确的反应,模型在 轨迹生成阶段 需要充分考虑周围交通参与者的行为 ...
端到端笔记:diffusion系列之Diffusion Planner
自动驾驶之心· 2025-07-09 20:56
自动驾驶算法模块 - 自动驾驶算法分为两大模块:场景理解(理解周围环境、预测agents行为)和决策(生成安全舒适轨迹、可定制化驾驶行为)[1][2] - diffusion planner工作聚焦于决策模块中的闭环场景性能提升[3] 自动驾驶规划方法对比 - rule-based方法(如PDM)依赖道路中心线选择和规则系统,存在迁移性差、人力成本高、缺乏灵活性等问题[4] - learning-based方法(如UniAD、VAD)通过模仿学习实现类人行为预测,但面临多模态数据分布学习困难,仍需依赖rule-based兜底[6] diffusion model技术优势 - 能更好拟合多模态驾驶行为数据分布,通过高斯加噪/降噪过程分解复杂问题[6] - 基于classifier guidance机制实现定制化驾驶行为,无需针对特定场景重新训练模型[6] - 已在图像生成、机器人动作生成、离线RL等领域验证其高效学习能力[11] diffusion planner核心技术 - 采用MLP-Mixer+self-attention的encoder结构进行高效信息提取[12] - 通过cross-attention降低计算量,DPM-Solver实现20Hz高速轨迹生成[12] - 同时完成自车规划和周车行为预测,支持定制化驾驶行为生成[12] 性能提升表现 - 测试数据显示在Test14、Test14-hard、Val14场景分别达到89.19、75.99、89.87分,显著优于Diffusion-es等对比模型[20] - 实现高质量轨迹生成和多模态驾驶行为拟合(如无导航信息下生成左转/右转/直行轨迹)[14][16] - 在毫末200小时物流车数据上展现强泛化能力,适应非机动车道行驶等特殊场景[23] 后续优化方向 - 数据量和模型参数量scale up对闭环性能的影响[28] - 端到端框架设计而不仅限于planner模块优化[28] - 训练和推理过程的进一步加速[28] - 实车场景下的高效guidance机制实现[28]