理想的VLA,不只是辅助驾驶
金融界·2026-01-22 17:22

文章核心观点 - 理想汽车通过量产搭载VLA(视觉-语言-行为)司机大模型的理想i8,实现了AI从模仿到理解物理世界的本质跃迁,其目标远超辅助驾驶本身,旨在将汽车打造为具备“人类智能”的具身智能基座,并引领行业向全新的“具身智能产业”演进 [1][7][12] 技术演进与VLA的里程碑意义 - 公司辅助驾驶技术经历了从依赖人工规则的“人工时代”(如BEV鸟瞰图、NPN先验网络),到通过模仿人类数据学习的“AI时代”(端到端+VLM架构),但后者存在不理解物理世界逻辑、性能提升放缓及行为违反常理等缺陷 [3] - 2025年初,当端到端模型训练数据超过1000万Clips后,性能提升放缓,“模仿学习”的缺陷显现,而VLM与端到端控制模型间的“沟通壁垒”和推理速度成为新瓶颈 [3] - VLA技术路线被提出以解决上述问题,其具备思维链式推理能力,能理解物理世界并将人类语义融入行为判断,标志着AI从“哺乳动物智能”向“人类智能”的演进 [3][7] VLA路线的选择依据与初期成效 - 公司选择VLA路线而非世界模型,主要基于两个原因:拥有超过150万辆车提供的海量真实数据及构建了数据闭环;在当前算力下,VLA能让辅助驾驶水平接近人类驾驶员 [6] - 截至2025年底,VLA司机大模型推送后月使用率达到80%,VLA指令使用次数达到1225.4万次,在某些场景下已展现出对物理世界的认知涌现和端到端模型没有的拟人行为 [6] - 2026年1月21日,通过OTA 8.2推送,AD Max平台的VLA司机大模型迎来升级,团队通过重新清洗筛选数据、替换约200万段优质驾驶数据进行强化训练,显著提升了模型能力,使驾驶体验更拟人化,减少了机械顿挫和无效变道 [10] VLA作为具身智能基座的战略价值 - 公司将未来赛道明确为“具身智能”,将汽车重新定义为“具身智能产品”,VLA是这一“机器人大脑”的核心基座,使其具备理解复杂场景、自然交互和持续进化的能力 [9][10] - VLA能力的持续扩展旨在最终突破L3/L4级自动驾驶门槛,使汽车蜕变为真正的“汽车机器人”,公司实质上是在锻造一套通用的具身智能AI系统(感知、模型、操作系统、算力、本体) [12] - 公司的实践不仅构筑了自身技术护城河,也为行业验证了一条融合大规模数据、先进算法与工程化能力,打造可进化“硅基生命体”的可行路径,自2025年以来已引发部分领先企业关注或探索VLA路线 [12] 行业影响与未来展望 - 辅助驾驶产业的终极形态可能并非只是“无人驾驶”,而是孵化出成熟的具身智能产品,传统汽车与人工智能的深度融合将催生全新的“具身智能产业” [12] - 产业变革的核心是系统性地打造能理解物理世界、可学习进化并能安全高效交互的AI系统,VLA司机大模型是公司面向这一广阔未来的关键答案 [14]