博世汽车业务近期研究动态与核心观点 - 作为国际Tier1巨头,博世正积极应对国内智驾领域的快速发展,在预研和量产两条线上投入资源,特别是在量产方面投入更多资源以落地一段式端到端技术,并招聘了技术专家 [2] - 公司在自动驾驶多个方向投入较大,并取得了丰硕成果,整体上跟上了前沿技术发展的脚步,并开始打造自身特色 [2] 端到端自动驾驶与视觉-语言-动作模型 - FlowDrive:提出一种融合能量流场表示、流感知锚点细化与任务解耦扩散规划的创新框架,通过物理可解释的流场显式编码风险与车道先验,在NAVSIM v2基准测试上取得最先进性能,EPDMS达86.3 [9][12] - AnchDrive:提出基于混合轨迹锚点初始化的截断扩散策略,融合动态与静态锚点,显著提升扩散模型效率,仅需2步去噪,在NAVSIM v2上取得SOTA性能,EPDMS达85.5 [13][14] - IRL-VLA:提出基于奖励世界模型的闭环强化学习框架,通过三阶段训练实现不依赖高保真仿真的端到端驾驶策略优化,在NAVSIM v2上EPDMS得分达74.9,并在CVPR2025自动驾驶大奖赛中获得亚军 [19] - DiffVLA:提出视觉-语言引导扩散规划框架,结合VLM语义引导与混合稀疏-稠密感知,在NAVSIM v2闭环评测中综合指标EPDMS达到45.0 [25] - Impromptu VLA:构建了首个大规模、公开、专注于非结构化驾驶场景的数据集,包含约8万段视频片段,覆盖四大挑战类别,基于该数据集训练的VLA模型在安全评分与轨迹精度上均有显著提升 [23] 高精地图构建与在线地图融合 - SparseMeXT:系统优化了基于稀疏表示的在线高精地图构建方法,在nuScenes数据集上使稀疏方法的精度和效率全面超越现有密集BEV方法,其中SparseMeXT-Large模型达到68.9% mAP,推理效率最高达32.9 FPS [21] - DiffSemanticFusion:提出通过地图扩散模块增强在线高精地图稳定性的框架,结合多模态融合,在nuScenes轨迹预测任务中将QCNet性能提升5.1%,在NAVSIM的NavHard复杂场景下取得15%的性能提升 [16] 静态感知与场景重建 - D²GS:提出一种仅依赖相机输入的动态城市街景重建框架,无需LiDAR,在Waymo Dynamic32数据集上的图像重建与深度估计指标均超越现有LiDAR监督及LiDAR-free方法 [5][8] - SparseMeXT:工作被IROS 2025接收,专注于高精地图构建 [20] 视觉基础模型 - DINO-R1:首次将强化学习思想引入视觉基础模型,提出Group Relative Query Optimization训练策略,提升了视觉提示检测中的泛化与推理能力,在COCO、LVIS和ODinW等多个数据集上显著优于传统监督微调基线 [27]
2025年的博世,正在脱胎换骨......
自动驾驶之心·2025-12-12 11:02