Workflow
小鹏VLA2.0
icon
搜索文档
告别2025!业内头部公司2025年硬核工作总结(地平线/理想/英伟达等)
自动驾驶之心· 2026-01-06 17:17
行业年度回顾与趋势 - 2025年是自动驾驶从“预研舒适区”走向“落地深水区”的一年,技术关键词从BEV感知、多传感器融合等走向成熟,转向端到端、VLM/VLA、世界模型等成为大众视野的新焦点 [2] - 前装智驾在2025年走向成熟,消费者质疑声减少,行业共识为“智驾这事,能成” [3][4] - 智能电动汽车产业的竞争已进入决赛阶段,技术升级迭代节奏加快,市场竞争压力加大 [21] - 2026年,L2级智能驾驶将告别技术飞速狂飙的时代,进入下沉攻坚期,同时针对L3的探索将渐入大众视野,L4也将迎来新一轮的规模破局 [22] 主要公司动态与成果 地平线 - 2025年打了一场漂亮的翻身仗,其HSD(Horizon Super Driving)方案直接破圈,展示了端到端方案的高上限 [9] - 在端到端、闭环训练、强化学习、世界模型和轨迹建模等领域研究深入,引领行业落地方案发展 [9] - 智驾研发团队已超过1000人,同时内部布局具身智能 [9] 小米汽车 - 小米智驾是2025年发展最快的,在四年时间内于新能源红海赛道杀出重围,年底发布了HAD增强版 [9] - 智驾迭代速度极快:从2024年3月的高精地图高速NOA,到2024年5月的城区NOA,2024年10月的轻图/无图版本,2025年2月的300万clips端到端版本,2025年7月的1000万clips版本,直至近期推出的世界模型版本 [10] - 沿着智能驾驶1.0规则驱动、2.0数据驱动、3.0认知驱动的三个阶段稳步扩展,未选择跳代研发 [10] - 2025年智驾研发团队突破1000人,预计2026年规模更上一层楼 [11] 理想汽车 - 自2024年端到端+VLM双系统量产以来,已跻身国内智驾第一梯队,在学术和量产方案上保持领先,是主推VLA量产的中坚力量 [13] - 公司处于增程转纯电、汽车转AI的转型阶段,但年度目标销量完成了58.05% [13] - 在智驾技术探索上提出了TransDiffuser、World4Drive、ReflectDrive等多个引起业内讨论的方案,覆盖前沿技术领域,并提出了从“数据闭环到训练闭环”的下阶段方向 [13] 小鹏汽车 - 2025年触底反弹,销量从2024年的19万辆翻倍至近43万辆,顺利完成全年目标 [14] - 凭借VLA 2.0顺利破圈,其核心逻辑是拆掉离散化的语言输出以提升效率,并实现自监督以大规模使用数据 [14] - 2025年基本all in量产,学术论文产出不多 [15] 博世汽车 - 作为国际Tier1巨头,被国内智驾飞速发展卷到,正猛抓预研和量产两条线 [16] - 在量产方面投入更多资源落地一段式端到端,并在闭环仿真(如DGS,NeurIPS 2025)和视觉基础模型(如DINO-R1)等方面有投入 [16] - 相比去年成果颇丰,大方向上跟上了前沿脚步并开始打造自己的特色 [16] 特斯拉 - 在ICCV 2025上的分享引起国内热情,整体仍沿用端到端范式 [19] - 亮点包括引入前馈GS极大提升闭环仿真能力,以及引入Language辅助Action输出 [19] - 在端到端和VLA、静态感知等方面有系列工作,如DiffVLA、AnchDrive、SparseMeXT等 [18] 英伟达 - 野心不局限于硬件公司,2025年在自动驾驶、具身智能、大模型和世界模型等最热AI赛道产出多篇重量级工作 [20] - 主要系列包括:Cosmos系列(世界基础模型平台)、Nemotron系列(为代理式AI打造的“数字大脑”)、具身系列(GR00T N1和Isaac Lab)、以及自动驾驶系列(如Alpamayo-R1自驾VLA框架) [25] Waymo - 作为全球L4级自动驾驶领军企业之一,其基座模型进展显示在follow国内的快慢双系统端到端方案,与理想E2E+VLM及小鹏VLA2.0有相似之处 [20]
从目前的信息来看,端到端的落地上限应该很高......
自动驾驶之心· 2025-11-12 08:04
行业技术趋势 - 地平线HSD表现超预期,一段式端到端方案重新成为行业量产重心,其性能上限很高 [1] - 小鹏VLA2.0采用视觉和语言并行输入,印证了VLA是技术核心 [1] - 行业整体技术路线正从两段式端到端向一段式端到端过渡,并进一步向VLA演进,多家团队已进行相应调整 [1] 课程核心内容 - 课程重点聚焦量产实践,涵盖一段式、两段式端到端、强化学习、导航应用、轨迹优化及兜底方案 [3] - 课程仅限40名学员,旨在面向就业直击落地 [3] 讲师背景 - 讲师王路拥有C9本科和QS50博士学历,发表多篇CCF-A/B论文 [5] - 现任国内顶级Tier1算法专家,从事大模型、世界模型等前沿算法的预研与量产,具备丰富的端到端算法研发和实战经验 [5] 课程大纲详解 - **第一章**:介绍主流的感知模型一体化架构和经典的规控learning化方案,以及端到端开源数据集和评测方式 [8] - **第二章**:讲解两段式端到端算法框架,包括建模方式、感知与PNC信息传递、优缺点分析,并通过PLUTO算法实战加深理解 [9] - **第三章**:介绍一段式端到端算法框架,其可实现信息无损传递,性能优于两段式,涵盖基于VLA和Diffusion等方法,并通过VAD系列进行实战 [10] - **第四章**:讲解导航地图的格式、内容信息,及其在端到端模型中的编码与嵌入方式,以有效发挥导航能力 [11] - **第五章**:重点介绍强化学习算法及训练策略,以弥补纯模仿学习的不足,实现更好的泛化能力 [12] - **第六章**:进行NN Planner项目实战,包括基于模仿学习(扩散模型、自回归算法)和强化学习的结合应用 [13] - **第七章**:介绍量产中的轨迹平滑优化等兜底方案,包括多模态轨迹打分搜索和轨迹平滑算法,确保输出轨迹稳定可靠 [14] - **第八章**:从数据、模型、场景、规则等多视角分享量产经验,讲解如何选用合适策略快速提升系统能力边界 [15] 课程安排与学员要求 - 课程于11月30日开课,预计三个月结课,采用离线视频教学,辅以VIP群答疑和三次线上答疑 [16] - 课程章节按周解锁,例如12月7日解锁第二章,12月14日解锁第三章等 [16][18] - 学员需自备GPU,推荐算力在4090及以上,并熟悉BEV感知、视觉Transformer、端到端算法、强化学习、扩散模型等,具备Python、PyTorch及数学基础 [17]
智联汽车系列深度之39:小鹏VLA2.0发布:智能驾驶体现更强大的泛化性
申万宏源证券· 2025-11-10 18:50
行业投资评级 - 报告对行业投资评级为“看好” [4] 核心观点 - 小鹏VLA2 0的发布标志着智能驾驶泛化能力的显著提升 在部分场景中已能实现类似人类驾驶员的反馈 [5] - VLA技术具备向其他具身智能领域(如机器人、低空经济)外溢的潜力 其架构有望被小鹏的机器人等产品复用 [5][31] - 本次技术迭代不仅限于算法 VLA2 0的实现深度结合了自研的图灵芯片 其在感知增强和低位宽支持方面具有优势 [7][34] 小鹏发布二代VLA 实现更多路况优化 - VLA2 0于2025年11月10日发布 其特点是效率更高、反应更快 目标为实现“小路更强悍 大路更舒适 场景更全面” [12] - 二代VLA的最大技术特点是砍掉了传统VLA中间的语言转译环节 实现了从视觉到动作的直接映射 此思路与DeepSeek OCR有异曲同工之妙 [4][15] - VLA2 0的核心在于输入信号尽量使用真实世界的物理信号(视频流) 输出空间使用连续信号而非文字的离散化表达 使得网络结构极其简单 [4][16] - 模型训练消耗了3万卡算力 训练费用超过20亿元 使用了近1亿条训练数据 [4][16] - 实测表现突出:可实现小路NGP 在20公里复杂小路行驶仅需接管一次;能读懂道路参与者手势;红灯倒计时结束时能先慢慢向前蠕行 [4][6][16] - 推送计划:2025年12月底部分先锋客户体验 2026年第一季度在Ultra车型上全量推送 Max车型也在规划中 [4][16] 算法:VLA/VLM历史与延展-机器人与低空 - VLA是当前具身智能领域主流模型 最早由Google DeepMind于2023年7月提出 [19] - VLA架构具备端到端、泛化能力强、通用性高等特点 使其在机器人领域具备应用潜力 [21] - VLA模型的历史演进脉络清晰:从单一模态处理→跨模态对齐→多模态理解生成→感知-决策-执行闭环 [6][24] - 由于技术方案未收敛 一二级市场对HRL、MPC、VLA、端到端等技术路径存在投资分歧 [6][29] - 小鹏第二代VLA的发布对VLA模型在产业界的应用形成了强力推动 [6][29] - VLA技术可能外溢至机器人、低空经济等其他具身智能领域 小鹏的机器人等产品有可能复用VLA2 0架构 [5][31] 算力:图灵芯片-感知与低位宽 - 小鹏VLA2 0基于自研的图灵芯片实现 [34] - 图灵芯片采用DSA架构 核心为40核ARM+双自研NPU+双独立ISP [35] - 芯片特别支持VLA的300亿参数模型 而对标产品往往仅支持10-50亿参数模型 [34] - 两大关键技术特点:1 独立ISP 增强模拟电路和感知部分 利于识别雾气/雨雪/深夜/逆光等复杂场景 2 推测支持低位宽 利于AI推理和自动驾驶 实现低功耗、低延迟 [7][34] - 与英伟达Orin相比 小鹏的Thor芯片支持低位宽和AI算法更充分 高通8797P也支持LLM_VLA 验证了此技术趋势 [7][34] 相关标的 - 报告提及的相关投资标的包括:小鹏汽车、德赛西威(小鹏的ADAS合作伙伴)、极智嘉、天准科技等 [4][5][38]