EvaDrive
搜索文档
小米智驾正在迎头赶上......
自动驾驶之心· 2025-11-03 08:04
小米汽车技术进展概述 - 小米汽车自2021年9月成立至2025年6月YU7发布,四年内在新能源领域快速发展[2] - 2025年下半年行业竞争焦点集中在智能驾驶、性价比及座舱体验,小米智驾正迎头赶上,新版本即将发布[2] - 2025年小米汽车团队在学术研究上成果显著,论文工作涉及VLA、世界模型、端到端等多个前沿方向,包括ORION、WorldSplat、EvaDrive、Dream4Drive等,探索生成模型在自动驾驶中的落地应用[2] 视觉语言行动模型与端到端驾驶 - **AdaThinkDrive**:引入"快速应答/慢速思考"双模式推理机制,在NAVSIM基准测试中PDMS达90.3,超越最佳纯视觉基线1.7分,在96%复杂场景使用CoT,84%简单场景直接输出轨迹,推理效率提升14%[6] - **EvaDrive**:采用进化对抗策略优化框架,实现轨迹生成与评估的闭环共进化,在NAVSIM v1上PDMS达94.9,Bench2Drive驾驶分数64.96,超越DiffusionDrive等方法[9] - **MTRDrive**:通过记忆-工具协同推理框架提升决策鲁棒性,在NAVSIM和Roadwork-VLM基准上表现出色,有效缓解幻觉问题[14] - **ReCogDrive**:融合VLM认知推理与强化学习增强的扩散规划器,在NAVSIM基准PDMS达90.8,推理速度较纯文本VLM方法提升7.8倍[18] - **ORION**:通过视觉语言模型指导动作生成,在Bench2Drive数据集驾驶分数77.74,成功率54.62%,较之前最优方法提升14.28分和19.61%[23] - **AgentThink**:将动态工具调用与思维链推理结合,在DriveLMM-o1基准整体推理分数提升53.91%,答案准确率提升33.54%[22] 世界模型与场景生成 - **Dream4Drive**:首创3D感知引导的合成数据生成框架,仅插入420个样本(不足真实数据2%)即可提升感知任务性能,在1×训练轮数下mAP从34.5提升至36.1,NDS从46.9提升至47.8[26] - **WorldSplat**:采用高斯中心化前馈式4D场景生成框架,在nuScenes数据集取得最优FVD与FID指标,支持多视角驾驶视频生成[31] - **ViSE**:通过视觉街景外推框架在ICCV 2025 RealADSim-NVS挑战赛综合得分0.441,PSNR达18.228,SSIM 0.514,LPIPS降至0.288[30] - **ExtraGS**:融合几何先验与生成先验,在Waymo数据集NTA-IoU达0.592,NTL-IoU达58.49,nuScenes外推FID@3m降至77.19[35] - **Genesis**:实现多视角视频与LiDAR点云序列联合生成,在nuScenes基准视频生成FVD 16.95、FID 4.24,LiDAR生成Chamfer距离0.611[41] - **Uni-Gaussians**:统一高斯表示方法结合光栅化与光线追踪,在Waymo数据集实现相机与LiDAR数据高效仿真[42] - **CoGen**:通过3D语义条件生成框架提升视频生成3D一致性,在nuScenes数据集FVD指标最优[44] - **MiLA**:实现长达一分钟多视角高保真视频生成,在nuScenes数据集FID与FVD指标达到最先进水平[48] 运动风险预测与感知增强 - **DriveMRP**:基于BEV运动仿真方法合成高风险运动数据,零样本评估准确率从基线29.42%大幅提升至68.50%,增强VLM在长尾场景的风险预测能力[13][15] 深度估计技术 - **Pixel-Perfect Depth**:采用像素空间扩散生成模型,在NYUv2、KITTI等基准AbsRel最低达4.1%,δ1准确率最高97.7%,边缘感知点云Chamfer距离仅0.08[51]
GRPO并非最优解?EvaDrive:全新RL算法APO,类人端到端更进一步(新加坡国立)
自动驾驶之心· 2025-08-15 07:33
自动驾驶技术进展 - 自动驾驶技术近年来取得显著进展,使车辆能够在复杂环境中导航,但将感知、预测和规划等模块整合成完整驾驶行为仍具挑战性[4] - 轨迹规划是核心挑战,需生成可行、安全且高效的运动轨迹[4] - 传统模块化方法易累积误差,端到端方法泛化能力不足,难以建模复杂驾驶决策的多模态性[6] EvaDrive框架创新 - EvaDrive提出全新多目标强化学习框架,通过对抗性优化在轨迹生成和评测间建立闭环协同进化[2] - 框架将轨迹规划表述为多轮对抗游戏,分层生成器结合自回归意图建模和基于扩散的优化[8] - 可训练多目标critic对候选路径进行严格评测,保留多样化偏好结构而非压缩为单一标量[8] 技术实现细节 - 分层规划器包含自回归意图生成器(捕捉时间因果关系)和基于扩散的优化器(提供空间灵活性)[20] - 采用去噪扩散隐式模型(DDIM)实现单步去噪,显著提升计算效率满足实时部署需求[21] - 多轮优化机制通过帕累托前沿选择避免局部最优,支持动态环境中的自适应规划[25][26] 性能表现 - 在NAVSIM v1基准测试中达到94.9 PDMS,超过DiffusionDrive 6.8分,DriveSuprim 5.0分[37] - 在Bench2Drive闭环测试中获得64.96驾驶分数,验证框架的闭环能力[37] - 通过动态加权可生成多样化驾驶风格(保守型/激进型)而无需外部偏好数据[37] 技术对比优势 - 传统生成-评测框架缺乏闭环交互,强化学习方法将多维偏好压缩为标量奖励[7] - EvaDrive首创将多轮多目标强化学习与对抗性策略优化(APO)结合用于轨迹优化[12] - 消融实验显示完整框架比基础模仿学习基线PDMS提升11.8分(83.1→94.9)[38][39] 行业应用价值 - 该方法为自动驾驶领域提供首个在开环/闭环设置中均能实现无标量化、偏好感知轨迹优化的解决方案[42] - 结构化非标量奖励模型避免传统方法的标量化偏差和标注噪声问题[42] - 技术路线可扩展至其他需要多目标决策的智能系统领域[12]