Workflow
自动驾驶VLA
icon
搜索文档
自动驾驶VLA工作汇总(模块化/端到端/推理增强)
自动驾驶之心· 2025-08-12 19:42
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 VLA前置工作:VLM作为解释器 论文标题:DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model 论文链接:https://arxiv.org/abs/2310.01412 主页:https://tonyxuqaq.github.io/projects/DriveGPT4/ 论文标题:TS-VLM: Text-Guided SoftSort Pooling for Vision-Language Models in Multi-View Driving Reasoning 论文链接:https://arxiv.org/abs/2505.12670 主页:https://github.com/AiX-Lab-UWO/TS-VLM 论文标题:DynRsl-VLM: Enhancing Autonomous Driving Perception with Dynamic Resolution Vision- L ...
自动驾驶前沿方案:从端到端到VLA工作一览
自动驾驶之心· 2025-08-10 11:31
最近很多同学咨询柱哥端到端和VLA的方案,相比于模块化方法,统一的感知、规控建模会带来更高的智驾能力上限,这些方案的技术难度上也更大。今天自动 驾驶之心汇总了行业里面参考最多的端到端和VLA算法。 更多内容欢迎移步自动驾驶之心知识星球,一个交流技术和方案的地方。 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 端到端思维导图一览。整体来说,端到端分为一段式和二段式两个大的方向,二段式更偏联合预测一些,感知作为输入,模型聚焦于自车的轨迹规划和他车的轨 迹预测。而一段式端到端则是建模从传感器输入到自车轨迹的输出的过程。具体又可以细分为基于感知的一段式端到端(UniAD)、基于扩散模型的一段式端到 端(DiffusionDrive)、基于世界模型的一段式端到端(Drive-OccWorld),这些方法各有侧重点,量产中会结合各种方法的优点进行模型优化。 而VLA则是VLM+E2E的延伸,期望通过大模型的能力赋予量产模型更高的场景理解能力,目前星球内部梳理了语言模型作为解释器的相关工作、模块化VLA汇 总、统一端到端VLA梳理及推理增强VLA的诸多算法汇总。星友们 ...