前沿技术发展路线 - BEV感知方案已完全成熟并广泛应用于量产 目前没有哪家智驾方案敢说BEV不能用 基于BEV的动态感知 静态感知 OCC感知全都可以做 [11] - 端到端方案在实际中除PR外未展现出相对两阶段模型的真正优势 从数据收集难度 训练代价等角度看 后者实操性更强 [3] - VLA/VLM成为行业新宠 提供解决corner case的可能性 但真正落地效果尚待验证 目前缺乏足够数据研究其在corner case上的表现 [4] - 扩散模型是轨迹生成的新方式 尤其适合多模轨迹生成 但真实场景表现仍需验证 [16] - 世界模型主要用于仿真和数据生成 在预训练和端侧推理方面仍有待挖掘 [49] 技术难点与挑战 - 当前最大难点是corner case处理 99%场景已能收敛 但非结构化乡村道路 多上下匝道等极端场景仍难以100%通过 [11] - VLA面临三大问题:缺乏验证数据 模型效率不足 训练方案仍依赖模仿学习 [4][5] - 小模型效果优化 大模型量化加速 车端芯片性能优化是VLM量产需要攻克的难点 [37] - 多模态语言模型存在幻觉问题 对视觉和激光雷达等模态的理解容易产生幻觉 [47] - 闭环仿真仍需发力 位姿不准时的重建质量和新视角效果是待解决问题 [16] 未来发展方向 - 构建基于BEV的自动驾驶专用VLM大模型是值得尝试的方向 [18] - 自动驾驶技术将围绕更安全的驾驶 更好的乘坐体验 更全面的场景覆盖发展 数据运营能力将成为核心竞争力 [26] - 中心化是未来趋势 从单车智能向V2X等群体智能发展 实现云端信息联合 [44] - 扩散模型在实时性方面的提升值得关注 如CVPR2025的DiffusionDrive [36] - 3D高斯可向世界模型发展 高斯核形状与核函数的替换有深挖空间 [49] 行业现状与趋势 - 2025年关键词是"智驾平权" 平价车型开始普及辅助驾驶 但低算力方案在corner case处理上仍力不从心 [33] - BEV感知从开源到广泛上车用了两年时间 而VLM等新技术尚未摸清就急于落地 行业风气浮躁 [45] - 自动驾驶符合二八定律 剩下20%长尾场景需要80%努力 方向是采用端到端和大模型 [35] - 行业竞争将从算法转向数据闭环效率 自动化工具链和AI驱动数据流水线是关键 [26] - L2+玩家注重VLM泛化性 L4玩家则聚焦世界模型以提升安全性 [23]
聊过十多位大佬后的暴论:自动驾驶还有很多事情没做,转行具身大可不必!
自动驾驶之心·2025-07-09 20:56