Workflow
FlowDrive
icon
搜索文档
2025年的博世,正在脱胎换骨......
自动驾驶之心· 2025-12-12 11:02
博世汽车业务近期研究动态与核心观点 - 作为国际Tier1巨头,博世正积极应对国内智驾领域的快速发展,在预研和量产两条线上投入资源,特别是在量产方面投入更多资源以落地一段式端到端技术,并招聘了技术专家 [2] - 公司在自动驾驶多个方向投入较大,并取得了丰硕成果,整体上跟上了前沿技术发展的脚步,并开始打造自身特色 [2] 端到端自动驾驶与视觉-语言-动作模型 - **FlowDrive**:提出一种融合能量流场表示、流感知锚点细化与任务解耦扩散规划的创新框架,通过物理可解释的流场显式编码风险与车道先验,在NAVSIM v2基准测试上取得最先进性能,EPDMS达86.3 [9][12] - **AnchDrive**:提出基于混合轨迹锚点初始化的截断扩散策略,融合动态与静态锚点,显著提升扩散模型效率,仅需2步去噪,在NAVSIM v2上取得SOTA性能,EPDMS达85.5 [13][14] - **IRL-VLA**:提出基于奖励世界模型的闭环强化学习框架,通过三阶段训练实现不依赖高保真仿真的端到端驾驶策略优化,在NAVSIM v2上EPDMS得分达74.9,并在CVPR2025自动驾驶大奖赛中获得亚军 [19] - **DiffVLA**:提出视觉-语言引导扩散规划框架,结合VLM语义引导与混合稀疏-稠密感知,在NAVSIM v2闭环评测中综合指标EPDMS达到45.0 [25] - **Impromptu VLA**:构建了首个大规模、公开、专注于非结构化驾驶场景的数据集,包含约8万段视频片段,覆盖四大挑战类别,基于该数据集训练的VLA模型在安全评分与轨迹精度上均有显著提升 [23] 高精地图构建与在线地图融合 - **SparseMeXT**:系统优化了基于稀疏表示的在线高精地图构建方法,在nuScenes数据集上使稀疏方法的精度和效率全面超越现有密集BEV方法,其中SparseMeXT-Large模型达到68.9% mAP,推理效率最高达32.9 FPS [21] - **DiffSemanticFusion**:提出通过地图扩散模块增强在线高精地图稳定性的框架,结合多模态融合,在nuScenes轨迹预测任务中将QCNet性能提升5.1%,在NAVSIM的NavHard复杂场景下取得15%的性能提升 [16] 静态感知与场景重建 - **D²GS**:提出一种仅依赖相机输入的动态城市街景重建框架,无需LiDAR,在Waymo Dynamic32数据集上的图像重建与深度估计指标均超越现有LiDAR监督及LiDAR-free方法 [5][8] - **SparseMeXT**:工作被IROS 2025接收,专注于高精地图构建 [20] 视觉基础模型 - **DINO-R1**:首次将强化学习思想引入视觉基础模型,提出Group Relative Query Optimization训练策略,提升了视觉提示检测中的泛化与推理能力,在COCO、LVIS和ODinW等多个数据集上显著优于传统监督微调基线 [27]
FlowDrive:一个具备软硬约束的可解释端到端框架(上交&博世)
自动驾驶之心· 2025-09-23 07:34
核心观点 - 提出FlowDrive自动驾驶框架 在BEV空间中引入基于能量的流场表示 显式编码风险势场与车道吸引力场 实现安全可解释的轨迹规划[2][7] - 采用任务解耦设计 分离运动意图预测与轨迹生成过程 减少梯度冲突与特征干扰[6][9] - 在NAVSIM v2基准测试中EPDMS评分达86.3 超越现有SOTA方法0.3分 在安全性与规划质量方面表现最优[3][40] 技术架构创新 - 风险势场通过高斯函数建模障碍物排斥力 计算公式为$$U_{risk}(u,v)=\sum_{i}\eta\exp\Biggl{(}-\frac{\left\|(u,v)-(u_{i},v_{i})\right\|^{2}}{2\sigma^{2}}\Biggr{)}$$[20] - 车道吸引力场结合横向距离与纵向弧长 计算公式为$$U_{lane}(u,v)=\frac{1}{2}k_{lat}d(u,v)^{2}+k_{lon}(L-s(u,v))$$[20] - 流感知锚定轨迹优化模块通过Transformer动态调整初始轨迹 使其与能量极小值区域对齐[7][22] - 运动解耦生成规划器采用条件扩散框架 使用两组门控查询分离意图预测与轨迹去噪任务[28] 实验性能表现 - 使用ResNet-34骨干网络时EPDMS达84.9分 超越DiffusionDrive的84.2分和DriveSuprim的83.1分[40] - 采用V2-99骨干网络后EPDMS提升至86.3分 较最优基准方法提升0.3分[40] - 在DAC(97.4)、DDC(99.6)、TTC(97.9)等安全指标上显著领先[40] - 多模态设置下(图像+激光雷达)性能与TransFuser、DiffusionDrive相当或更优[41] 消融实验验证 - 移除流场学习模块导致EPDMS从86.3降至85.8[43][47] - 禁用自适应锚定优化使EPDMS下降0.4分[43][47] - 取消运动解耦设计导致性能降低0.2分[43][47] - 流场参数最优配置为$$k_{lat}=10.0$$, $$k_{lon}=1.0$$, $$\eta=1.0$$, $$\sigma=10.0$$[43] 行业技术背景 - 端到端自动驾驶成为主流范式 基于BEV的方法可分为回归式(如UniAD、VAD)与生成式(如GenAD、DiffusionPlanner)两类[10][11] - 流场表示在机器人领域早有应用 但此前未有效整合进端到端自动驾驶框架[12] - 多任务学习采用MoE、MMoE等门控机制 但现有方法存在特征纠缠问题[13]