VLA技术发展路线图 - 短期目标是在2025年底至2026年初搭建出训练的强化闭环,目标是让用户体验到车辆“活”了的感觉,实现持续成长 [1] - 中期目标是通过强化闭环在中国市场超越特斯拉,核心优势在于拥有比特斯拉更便利的闭环迭代环境 [1] - 两年周期内,VLA结合强化学习将引发业务大变革,预计2025年开始,经过2025-2026两年迭代,到2027年将形成企业真正的护城河,即整个业务流程的变革能力而非单一的模型、数据或芯片 [1] - 远期目标是利用VLA技术实现L4级别自动驾驶,并预期未来还会有新技术出现 [1] 强化闭环系统的工作机制与价值 - 强化闭环系统能自动识别问题,如用户接管、驾驶顿挫、急刹车等,自动收集问题数据并回传进行强化训练,完成迭代后上线,实现自我优化 [2] - 该能力被视为未来自动驾驶运营商的核心立足点之一,但可能不构成严格的护城河,因为最终可能有多家主体掌握自动驾驶技术 [2] 对VLA技术路径的倾向性看法 - 认为驾驶所需的智能程度相对较低,以目前大语言模型展现的智能水平足以应对自动驾驶,主要需解决时延问题 [3] - 业务流程改革完成后,经过1-2年时间,能更清晰界定车端算力与模型参数量需求,倾向于需求不会太大,给出的锚点是车端1000或2000 TOPS,云端32B参数模型,并认为将320B模型蒸馏成4B很不合适 [3] - 存在一种观点认为,在遇到明显瓶颈期前,算力和参数量整体上是越大越好,这与“the bitter lesson”的核心思想一致,即充分利用算力的通用方法最终会胜出 [3] 技术方法论与行业趋势 - DeepSeek的方法在浅层上通过更好的方法降低了对算力的需求,但深层内核符合“the bitter lesson”,其方法本身是通用的元方法,可通过增加算力提升性能 [4][5] - 自动驾驶领域的前进方向符合“the bitter lesson”,任何试图将人类对世界的理解硬编码到算法中的尝试大概率会被淘汰 [5] - 理想团队认为华为的W Engine与其所说的世界模型概念相似,而其他友商关于世界模型的讨论仍停留在模型本身层面 [9] 公司领导力与战略决策 - 公司CEO在2025年2月底提出加快交付VLA,其判断基于模仿学习本质不具备人类智能 [6] - CEO与校招生保持每月一次沟通,与自动驾驶负责人之间建立了基于信任的默契和并肩作战的基础 [6] - 公司管理强调“关注人不关注事”,团队内部的双向信任是公司能够调整价值观稀释问题的基础 [6] 智驾部门组织架构调整 - 智驾团队的核心护城河被定位为业务体系而非个人,部门现设有11个二级部门,负责人均具备业务背景而非纯管理出身 [7] - 核心管理者倾向内部培养,而Research/算法研究人才可从外部引进 [7] - 具体部门调整包括将原模型算法团队拆分为基础模型部、VLA模型部和模型工程部等,并新增创新业务部 [7] - 取消封闭开发模式,原因包括追赶者收益降低以及体现员工关怀,公司高层可能已形成阶段性共识需提高员工关怀 [7] - 部门负责人自述团队经历了三代骨干更迭,当前为新班子主导 [7] 对竞争对手的评价与定位 - 团队非常关注特斯拉FSD V14的进展,并计划在美国进行实车体验,认为特斯拉Ashok在ICCV 2025上的演讲与理想VLA理念高度一致 [8] - 回应博世不看好VLA的观点,指出博世不自研基座模型且缺乏大模型相关工作经验,数据量不大,并认为可通过强化学习和超级对齐解决模型幻觉问题 [9] - 针对华为的观点,强调在完成端到端过程中发现corner case数据收集的核心在于数据分布和质量,需要系统具备人类思维推理能力,并认为反对VLA的声音恰恰证明了VLA方向的正确性 [9] 公司运营与资源规划 - 公司战略分析法的核心是认知决定战略,战略决定业务,业务决定组织和资源 [12] - 2024年公司云端算力为8 EFLOPS,价值约10亿人民币数量级,当前推理算力与训练算力投入各占一半被认为比较合理 [11] - 公司正在研发42B参数的云端模型,并希望云端模型参数量不要过大 [11] - 对于自研自动驾驶芯片,策略是如果一颗芯片效果不佳,就采用两颗芯片的方案 [11] - 预测到2027年行业可能不再使用MPI作为核心评价指标 [11] - 2023年公司主基调是扩招,但自动驾驶负责人认为团队规模不需过大,比特斯拉团队多一些即可 [11] - 自动驾驶负责人将50%精力投入短期日常管理事务,30%投入中长期战略规划,20%投入技术和业务进展 [11]
郎咸鹏给理想VLA新画的4个饼以及值得留意的5点