Workflow
理想郎咸朋:VLA 加强化学习将成为车企真正的护城河
晚点LatePost·2025-11-04 16:03

公司战略与技术路线 - 公司认为无法在竞争对手已建立的规则方案战场上取胜,必须开辟新战场,通过技术代际提升实现超越 [13][14][16] - 公司自动驾驶发展遵循明确时间节点:2021年确认技术方案,2023年拿到入场券,2025年成为顶级公司,2027年实现L4常态化运营 [41] - 公司战略从跟随转向引领,2023年底至2024年初资源充足后,目标变为在智能化上显著超越华为 [16] - 技术路线经历三次重大演变:从规则方案到端到端模型,再到当前的视觉-语言-行动模型,每次转变都是为了建立新竞争优势 [5][16][18] 视觉-语言-行动模型技术 - VLA模型旨在让自动驾驶系统具备类似人类的思考推理能力,而非单纯模仿驾驶行为,项目代号为“斯芬克斯” [5][21] - 公司认为VLA结合强化学习将形成新的护城河,并演化成未来企业走向人工智能的护城河 [6] - 针对外界对VLA多模态对齐、数据训练、模型幻觉和芯片适配的质疑,公司回应称已具备相关能力积累,现有数据量达十几亿公里 [21][24][39] - VLA车端模型参数量为40亿,云端模型目标为320亿,公司认为驾驶任务不需要像GPT-3那样1750亿的超大模型 [37] 组织架构与团队管理 - 公司近期将智驾团队重组为11个二级部门,部门负责人直接向研发高级副总裁汇报,旨在打造更扁平、高效的AI组织 [8][9] - 团队发展已历经三代骨干更替,核心管理者和技术负责人均从内部培养成长 [52] - 公司宣布取消大规模封闭研发模式,转向各部门发挥业务专长共同协作,体现对员工的关怀和管理思路转变 [10] - 团队规模控制在千人左右,坚持精兵策略,认为数据闭环和强化训练闭环成熟后无需数千人团队 [60][61] 数据与算力基础设施 - 公司认为自动驾驶的本质是高效运营数据闭环,其能力公式为有效驾驶区域 = 算法能力 × 有效数据量 × 数据闭环效率 [42][58][59] - 公司累计数据量从2021年前不到1亿公里,发展到如今十几亿公里,并有意识采集高质量数据而非盲目追求数据量 [39] - 公司当前云端算力为100亿亿次浮点运算的训练算力加30亿亿次浮点运算的推理算力,去年投入约10亿元人民币达到80亿亿次浮点运算算力 [33][36] - 算力投入不设上限,未来训练与推理算力预计各占一半,最终将收敛到合理数值 [33][34][35] 技术演进与行业竞争 - 端到端模型在2023年量产落地,解决了跟随慢车不绕行、复杂路口看不懂红绿灯等长尾问题,使公司跻身智驾第一梯队 [12][16][19] - 公司认为端到端模仿学习存在天花板,今年春节后资源加速向VLA倾斜,目标是实现L4级自动驾驶 [19][20] - 针对特斯拉FSD进入中国,公司认为双方目前差距尚未拉开,但VLA强化闭环实现自我迭代后将形成代际差别,有望在中国市场超越特斯拉 [44] - 公司观察到特斯拉最新FSD版本也已引入语言模块和多模态任务,与VLA理念高度一致,双方技术路径方向一致但实现细节不同 [44][45] 研发历程与关键节点 - 公司智驾自研起步于2021年的“卫城”项目,团队不足100人,用90天交付基础辅助驾驶功能,完成从0到1的突破 [11][49][51] - 研发过程中曾经历高强度封闭开发,例如为交付端到端1000万片段版本,核心团队持续两三个月每天早晨8点开晨会 [12] - 2019年资源极度匮乏时期,团队曾使用碰撞测试报废车辆安装价值300多万元的激光雷达进行技术预研 [54] - 从2021年交付基础辅助驾驶到2023年实现城市导航辅助驾驶,公司通过连续封闭开发完成了关键功能追赶 [10][15]