Flow Planner
搜索文档
自动驾驶论文速递!VLA、世界模型、强化学习、轨迹规划等......
自动驾驶之心· 2025-10-18 12:00
DriveVLA-W0:世界模型增强自动驾驶VLA - 提出DriveVLA-W0训练范式,通过世界建模预测未来图像提供密集自监督信号,解决VLA模型“监督不足”瓶颈,增强泛化能力与数据扩展性[2][6] - 在NAVSIM v1/v2基准上分别达到93.0 PDMS与86.1 EPDMS,推理延迟降至基线VLA的63.1%[2][6] - 设计轻量级MoE动作专家,将推理延迟降至基线VLA的63.1%[6] - 在70M帧大规模内部数据集上验证数据缩放律放大效应,VQ模型ADE降低28.8%,ViT模型碰撞率降低15.9%[6][9] - 在NAVSIM v1基准上PDMS达93.0%,单摄像头优于多传感器竞品[6][9] CoIRL-AD:协同竞争式模仿强化学习框架 - 提出竞争性双策略框架CoIRL-AD,将模仿学习与强化学习结合在潜在世界模型中[13][15] - 在nuScenes数据集上碰撞率降低18%,在Navsim基准上PDMS得分达88.2[13][15] - 利用潜在世界模型实现基于“想象”的模拟,将强化学习融入端到端自动驾驶框架,无需依赖外部模拟器[15] - 设计基于竞争的学习机制,实现IL与RL的联合训练与结构化互动,避免梯度冲突[15] PAGS:优先级自适应高斯泼溅动态场景重建 - 提出Priority-Adaptive Gaussian Splatting框架,通过语义引导剪枝与正则化实现高质量实时3D重建[23][27] - 在Waymo数据集上达到PSNR 34.63,SSIM 0.933,渲染速度353 FPS,训练时间仅1小时22分钟[23][27][30] - 基于静态语义分数和动态梯度贡献分数的混合重要性度量,简化非关键场景元素,保留安全关键目标细粒度细节[27] - 模型尺寸530 MB,显存占用6.1 GB,优于EmerNeRF、StreetGS等主流方法[27][30] Flow Planner:流匹配自动驾驶规划 - 基于流匹配和交互行为建模技术,在nuPlan Val14基准测试中达到90.43分,是首个无需先验知识突破90分的学习型方法[34][38][40] - 在interPlan基准测试中比Diffusion Planner提升8.92分[34][40] - 提出细粒度轨迹分词技术,将轨迹分解为含重叠区域片段,解决全轨迹建模复杂度高问题[35][40] - 构建交互增强的时空融合架构,通过自适应层归一化将异质特征投影到统一latent空间[40] CymbaDiff:草图驱动3D语义场景生成 - 提出CymbaDiff模型,结合圆柱Mamba结构与空间扩散机制,实现基于草图与卫星图像的3D语义城市场景生成[44][47] - 在Sketch-based SemanticKITTI上FID达40.74,比现有方法提升约16分[44][47] - 构建首个面向3D户外语义场景生成的大规模草图驱动基准数据集SketchSem3D[47] - 设计圆柱曼巴扩散模型,显式编码圆柱连续性与垂直层级,提升空间连贯性[47] DriveCritic:VLM自动驾驶评估框架 - 提出DriveCritic框架,利用视觉语言模型进行上下文感知的自动驾驶评估,在人类偏好对齐任务中达到76.0%准确率[55][57][58] - 揭示现有规则化指标缺乏上下文感知能力与人类对齐性的缺陷[57] - 构建DriveCritic数据集,从NAVSIM采样5730个轨迹对,标注pairwise人类偏好[57] - 采用监督微调加强化学习微调两阶段训练,使模型具备跨视觉符号上下文的轨迹判优能力[57][58]
扩散规划器全新升级!清华Flow Planner:基于流匹配模型的博弈增强算法(NeurIPS'25)
自动驾驶之心· 2025-10-16 07:33
文章核心观点 - 清华大学AIR研究院等机构提出全新自动驾驶决策算法框架Flow Planner,该框架基于Flow Matching生成式模型,在轨迹表征、模型架构和生成机制三方面进行协同改进,旨在解决复杂交通场景下的博弈行为建模挑战 [1] - Flow Planner在高密度车流多车博弈、行人突发横穿等激烈竞争场景下,能够动态感知周围意图变化并生成自然流畅的类人规划轨迹 [1] - 实验结果显示,Flow Planner在nuPlan闭环评测及新设立的interPlan高交互基准上均取得了学习型算法的SOTA性能,决策成功率和轨迹质量显著超越现有扩散模型规划方法 [1] 技术背景与挑战 - 自动驾驶规划的核心挑战在于多车密集、行为多样的交通场景中实现安全可靠且类人的决策,传统规则方法缺乏泛化能力,而学习型方法面临博弈行为建模不足和高质量博弈数据稀缺两大核心挑战 [3][6] - 当前学习型规划方法简单地增大模型参数量难以有效捕捉博弈关系,容易导致过拟合和呆板驾驶行为,而引入过多人工结构设计又会增大模型复杂度 [6] - 高密度强博弈场景在训练数据中呈显著长尾分布,模型难以通过模仿学习准确捕捉专家驾驶意图 [6] 关键技术创新:细粒度轨迹分段表示 - Flow Planner将轨迹划分为多个重叠片段并为每个片段建立局部token表示,改变了传统用整体token表示完整轨迹的方法 [8] - 该策略使模型能够保持运动学连续性、精确捕捉不同时间段交互模式、提升多模态驾驶行为的可表达性 [8][12] - 局部建模加全局拼接的策略兼顾表达力与平滑性,有效改善了规划轨迹的连贯性与多样性 [8] 关键技术创新:博弈增强时空融合机制 - 设计了基于尺度自适应注意力的特征融合模块,使模型能够在统一特征空间中同时处理车道、自车与周车轨迹信息 [9][13] - 模块能基于具体场景动态调整每个token的感受野大小,自动聚焦于关键交互对象 [9][13] - 通过独立的Adaptive LayerNorm与FFN模块优化异构信息融合,避免不同模态特征互相干扰 [13] 关键技术创新:周车增强轨迹生成 - 利用流匹配模型的无分类器引导生成策略,在推理时通过调整周车信息、道路信息等生成条件的权重来放大其对轨迹规划的影响 [10] - 该机制能引导模型生成超越数据的驾驶行为与策略,并帮助模型平衡保守与激进策略,在交互密集场景中生成更自然可控的驾驶行为 [10] 实验性能结果 - 在nuPlan的Val14基准上首次突破90分大关,得分90.43,不依赖任何规则先验或后处理模块 [11][14] - 在引入基于规则的后处理模块后,Flow Planner表现与最优混合式方法相当甚至更优,得分94.31 [11][14] - 在新设立的interPlan高交互基准上,整体性能提升8.9分,在高密度交通、行人横穿等极端交互情境下展现出卓越反应策略 [15] - 在部分分布外场景中展现出出色泛化能力,如对训练数据中未出现的“前车撞车”场景能准确判断并采取绕行策略 [15][20]