报告行业投资评级 - 报告看好以小鹏 VLA2.0 为代表的算法推进,认为智能驾驶泛化能力将继续提升 [4] 报告核心观点 - 小鹏汽车发布的 VLA2.0 实现了技术突破,具备更强大的泛化能力和类似人类驾驶员的反馈 [3][4] - VLA 技术具备向其他具身智能领域(如机器人、低空经济)外溢的潜力 [3][4][29] - 小鹏 VLA2.0 的成功离不开自研图灵芯片在感知和低位宽推理方面的支持 [32][34] 小鹏发布二代 VLA,实现更多路况优化 - VLA2.0 效率更高、反应更快,做到了“小路更强悍,大路更舒适,场景更全面,丝滑贯通不同路况” [9] - 二代 VLA 最大特点是砍掉了传统 VLA 中间的语言转译环节,直接实现从视觉到动作,减少了信息损耗 [2][12] - VLA2.0 的两个核心是:输入信号尽量使用真实世界的物理信号(video stream),输出空间使用更多的连续信号,使得网络结构极其简单 [2][14] - 二代 VLA 在训练过程中消耗了 3 万卡算力,20 亿元以上训练费用,近 1 亿训练数据 [2][14] - 在实测中,VLA2.0 可以实现小路 NGP,行驶 20 公里的复杂小路仅需接管一次;能读懂道路参与者的手势;红灯倒计时结束时能慢慢向前蠕行 [3][5][14] - VLA2.0 计划于 26Q1 后在 Ultra 车型上全量推送,Max 车型也在规划中 [2][15] 算法:VLA/VLM 历史与延展-机器人与低空 - VLA(视觉-语言-动作模型)是一种将视觉输入、语言推理与动作输出端到端融合的模型,最早由 Google DeepMind 于 2023 年 7 月提出 [17][19] - VLA 模型的历史演进脉络清晰:从单一模态处理(BERT/ViT)→跨模态对齐(CLIP/BLIP)→多模态理解生成(DINO/LLaVA)→感知决策执行闭环(RT-2/OpenVLA) [3][5][20][22] - 由于技术方案未收敛,一二级市场对 HRL(分层强化学习)/MPC(模型预测控制)/VLA/端到端等不同技术路径存在投资分歧 [3][5][27][28] - 小鹏第二代 VLA 的发布对这类模型在产业界的应用形成了强力推动 [3][5][27] - VLA 技术可能会外溢到其他具身智能领域,例如机器人与低空经济,小鹏的机器人和其他产品有可能复用 VLA2.0 的架构 [3][29][30][31] 算力:图灵芯片-感知与低位宽 - 小鹏 VLA2.0 基于自研的图灵芯片,该芯片采用 DSA 架构,包含 40 核 ARM+双自研 NPU+双独立 ISP [32][33][35] - 图灵芯片特别支持 VLA 的 300 亿参数模型,而对标产品往往仅支持 10-50 亿参数模型 [32][35] - 图灵芯片的两大技术特点是:独立 ISP,模拟电路和感知部分增强,利于识别雾气/雨雪/深夜/逆光等场景;推测支持低位宽,利于 AI 推理,实现低功耗、低延迟 [3][6][32][34] - 与英伟达 Orin 相比,图灵芯片在支持低位宽和 AI 算法(VLA)方面更充分,高通 8797P 也支持 LLM VLA,验证了这一技术趋势 [3][6][32][35] 相关标的 - 报告提及的相关标的包括:小鹏汽车、德赛西威(小鹏的 ADAS 合作伙伴)、极智嘉、天准科技等 [3][4][36] - 根据盈利预测,德赛西威 2025年预计净利润为26.4亿元,对应PE为27倍;极智嘉2025年预计净利润为1.2亿元,对应PE为261倍;天准科技2025年预计净利润为1.5亿元,对应PE为67倍 [37][38]
小鹏 VLA2.0 发布:智能驾驶体现更强大的泛化性:智联汽车系列深度之 39
申万宏源证券·2025-11-10 20:57