小鹏VLA2.0
搜索文档
从目前的信息来看,端到端的落地上限应该很高......
自动驾驶之心· 2025-11-12 08:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 这一个月,业内有几件值得大家留意。 一是地平线HSD的表现超预期 ,一段式端到端重回业内量产重心,上限其实很高。 二是视觉和语言并行输入的小鹏VLA2.0 也侧面印证VA才是核心。 自动驾驶之心也了解到一些团队也正在做出相应的调整。整体思路上,先从两段式端到端往一段式端到端过渡,再进一步向VLA演进。 从去年开始,就有很多同学咨询自动驾驶之心想学习这块的量产经验,借此转方向或者跳槽。我们也苦于一直没有经验丰富的技术专家,调研之后发现端到端量产 涉及的技术栈其实很丰富:导航信息在量产中如何使用,业内都在强调的强化学习又是如何具体应用的,Diffusion和自回归在量产中有哪些坑容易踩,而量产中离 不开的兜底方案又是如何做的,具体工作中模型优化、数据优化和场景优化都有哪些经验可以借鉴。 我们花了很久时间思考如何把量产经验传授给大家。 为此我们联合工业界大佬开展了这门《面向端到端量产的实践小班课》!课程只有一个重点:聚焦量产。从一段式、两段式、强化学习、导航应用、轨迹优化、兜 底方案再到具体量产经验分享。面向就业直 ...
智联汽车系列深度之39:小鹏VLA2.0发布:智能驾驶体现更强大的泛化性
申万宏源证券· 2025-11-10 18:50
行业投资评级 - 报告对行业投资评级为“看好” [4] 核心观点 - 小鹏VLA2 0的发布标志着智能驾驶泛化能力的显著提升 在部分场景中已能实现类似人类驾驶员的反馈 [5] - VLA技术具备向其他具身智能领域(如机器人、低空经济)外溢的潜力 其架构有望被小鹏的机器人等产品复用 [5][31] - 本次技术迭代不仅限于算法 VLA2 0的实现深度结合了自研的图灵芯片 其在感知增强和低位宽支持方面具有优势 [7][34] 小鹏发布二代VLA 实现更多路况优化 - VLA2 0于2025年11月10日发布 其特点是效率更高、反应更快 目标为实现“小路更强悍 大路更舒适 场景更全面” [12] - 二代VLA的最大技术特点是砍掉了传统VLA中间的语言转译环节 实现了从视觉到动作的直接映射 此思路与DeepSeek OCR有异曲同工之妙 [4][15] - VLA2 0的核心在于输入信号尽量使用真实世界的物理信号(视频流) 输出空间使用连续信号而非文字的离散化表达 使得网络结构极其简单 [4][16] - 模型训练消耗了3万卡算力 训练费用超过20亿元 使用了近1亿条训练数据 [4][16] - 实测表现突出:可实现小路NGP 在20公里复杂小路行驶仅需接管一次;能读懂道路参与者手势;红灯倒计时结束时能先慢慢向前蠕行 [4][6][16] - 推送计划:2025年12月底部分先锋客户体验 2026年第一季度在Ultra车型上全量推送 Max车型也在规划中 [4][16] 算法:VLA/VLM历史与延展-机器人与低空 - VLA是当前具身智能领域主流模型 最早由Google DeepMind于2023年7月提出 [19] - VLA架构具备端到端、泛化能力强、通用性高等特点 使其在机器人领域具备应用潜力 [21] - VLA模型的历史演进脉络清晰:从单一模态处理→跨模态对齐→多模态理解生成→感知-决策-执行闭环 [6][24] - 由于技术方案未收敛 一二级市场对HRL、MPC、VLA、端到端等技术路径存在投资分歧 [6][29] - 小鹏第二代VLA的发布对VLA模型在产业界的应用形成了强力推动 [6][29] - VLA技术可能外溢至机器人、低空经济等其他具身智能领域 小鹏的机器人等产品有可能复用VLA2 0架构 [5][31] 算力:图灵芯片-感知与低位宽 - 小鹏VLA2 0基于自研的图灵芯片实现 [34] - 图灵芯片采用DSA架构 核心为40核ARM+双自研NPU+双独立ISP [35] - 芯片特别支持VLA的300亿参数模型 而对标产品往往仅支持10-50亿参数模型 [34] - 两大关键技术特点:1 独立ISP 增强模拟电路和感知部分 利于识别雾气/雨雪/深夜/逆光等复杂场景 2 推测支持低位宽 利于AI推理和自动驾驶 实现低功耗、低延迟 [7][34] - 与英伟达Orin相比 小鹏的Thor芯片支持低位宽和AI算法更充分 高通8797P也支持LLM_VLA 验证了此技术趋势 [7][34] 相关标的 - 报告提及的相关投资标的包括:小鹏汽车、德赛西威(小鹏的ADAS合作伙伴)、极智嘉、天准科技等 [4][5][38]