端到端笔记：diffusion系列之Diffusion Planner

自动驾驶算法模块 - 自动驾驶算法分为两大模块：场景理解（理解周围环境、预测agents行为）和决策（生成安全舒适轨迹、可定制化驾驶行为）[1][2] - diffusion planner工作聚焦于决策模块中的闭环场景性能提升[3] 自动驾驶规划方法对比 - rule-based方法（如PDM）依赖道路中心线选择和规则系统，存在迁移性差、人力成本高、缺乏灵活性等问题[4] - learning-based方法（如UniAD、VAD）通过模仿学习实现类人行为预测，但面临多模态数据分布学习困难，仍需依赖rule-based兜底[6] diffusion model技术优势 - 能更好拟合多模态驾驶行为数据分布，通过高斯加噪/降噪过程分解复杂问题[6] - 基于classifier guidance机制实现定制化驾驶行为，无需针对特定场景重新训练模型[6] - 已在图像生成、机器人动作生成、离线RL等领域验证其高效学习能力[11] diffusion planner核心技术 - 采用MLP-Mixer+self-attention的encoder结构进行高效信息提取[12] - 通过cross-attention降低计算量，DPM-Solver实现20Hz高速轨迹生成[12] - 同时完成自车规划和周车行为预测，支持定制化驾驶行为生成[12] 性能提升表现 - 测试数据显示在Test14、Test14-hard、Val14场景分别达到89.19、75.99、89.87分，显著优于Diffusion-es等对比模型[20] - 实现高质量轨迹生成和多模态驾驶行为拟合（如无导航信息下生成左转/右转/直行轨迹）[14][16] - 在毫末200小时物流车数据上展现强泛化能力，适应非机动车道行驶等特殊场景[23] 后续优化方向 - 数据量和模型参数量scale up对闭环性能的影响[28] - 端到端框架设计而不仅限于planner模块优化[28] - 训练和推理过程的进一步加速[28] - 实车场景下的高效guidance机制实现[28]