Workflow
2025智驾“大逃杀”,谁能解决“长尾问题”?
虎嗅·2025-09-05 15:25

VLA技术商业化进展 - 理想汽车借纯电旗舰i8上市向全量用户推送VLA司机大模型[2] - 元戎启行发布自研VLA大模型DeepRoute IO 2.0 覆盖5款车型约20万台车[2] - 小鹏汽车新一代VLA架构实现时延<100 ms 规划帧率20 Hz[3] VLA技术优势 - 通过语言文字中间环节将路况图像抽象化 提升泛化能力[8] - 具备思维链能力可分解驾驶决策为逻辑连贯步骤[9] - 模拟人类"观察→判断→动作"认知过程 构建视觉-语言-动作闭环系统[10][12] 技术实施门槛 - 训练需吞吐22T token级多模态数据 单次训练规模相当于DeepSeek-V3的1.5倍[13] - 90%训练数据来自29.3亿公里实车日志 长尾场景需5-10倍数据密度[13] - 理想和小鹏分别动用13 EFLOPS与8 EFLOPS云端算力集群[14] 行业竞争格局 - 2025年城市NOA规模化交付与Robotaxi商业化存在空档期 先完成VLA量产者占优[6] - 华为与Momenta已占据2025年智驾市场90%份额[45] - 英伟达Thor-U芯片40万片产能中32万片已被理想/蔚来/小鹏提前锁定[27] 中小车企困境 - 哪吒乌兰察布集群180 PFLOPS算力无法在30天内完成7B参数模型训练[15] - 租用公有云单次训练成本达1.2-1.5亿元 相当于哪吒2024年研发预算40%[15] - 需交付10万辆级量产车才具备搭建VLA架构的基本数据基础[17] 替代技术路线 - 华为World Action Model通过扩散生成模型批量制造Corner case案例[33] - 蔚来NIO World Model将激光雷达+视觉压缩成3D token推演多帧场景[35] - WA路线被视为"理想主义的未来豪赌" VLA则是"实用主义的当下生存"[36] 头部企业战略布局 - 理想汽车通过VLA重新定义产品 应对单车毛利率从21.5%下滑至19.8%的压力[42] - 小鹏72B云端基座模型采用VLA混合架构 同时服务汽车与机器人业务[43] - 华为智驾优势建立在数据+软硬一体+车厂绑定三位一体的护城河上[45] 行业影响展望 - VLA量产是千卡训练云+千TOPS车端+千亿级数据三线并进的极限工程[16] - 技术路线分化将导致市场份额重组 头部企业差距可能缩小[46][50] - 2025年可能成为华为/特斯拉的巅峰时刻或理想/小鹏的逆袭元年[51]