Workflow
对话郎咸朋:VLA 技术论战、团队换血与不被看好时的自我证明

技术战略与路线选择 - 公司认为无法通过模仿领先者(如华为)的方式实现超越,必须开辟新的技术战场,因此选择研发下一代技术如“端到端”和VLA(视觉-语言-行动模型)以实现代际提升[3][13][16][17] - 2023年底公司决定从规则方案转向“端到端”架构,使智驾能力进入第一梯队;2024年初进一步选择VLA路径,目标是让系统具备类似人类的推理能力,而非单纯行为模仿,以争取成为没有争议的行业第一[3][16][19] - VLA被视为实现L4级自动驾驶的关键路径,其核心优势在于无监督训练和更高的迭代效率,预计最晚明年初用户可体验到显著提升;公司认为反对声音恰恰验证了VLA方向的正确性[3][18][23][24] 组织架构与团队演进 - 2024年9月公司对智驾团队进行重组,将原有4-5个二级部门拆分为11个部门,负责人直接向研发高级副总裁汇报,旨在打造更扁平的AI组织以提升决策效率和适应性[6][7][8] - 团队自2018年成立以来已更换三代骨干,早期成员多因资源投入分歧离职;当前核心管理层强调从内部培养,二级部门负责人均具备业务和技术背景,而非纯管理出身[8][46][47][49] - 公司取消大规模封闭研发模式,转向各部门发挥专长共同协作,反映其从追赶者到领先者的角色转变,同时注重员工关怀与可持续能力建设而非单纯压榨工时[8][9] 研发历程与关键节点 - 自研起步阶段(2019年)资源极度匮乏,团队曾使用碰撞测试报废车辆安装激光雷达进行预研,单个激光雷达成本达60-80万元,总投入约300余万元[3][50] - 2021年启动首个全栈自研项目“卫城”,团队不足100人,通过连续封闭开发(如每天全员到岗、凌晨加班)在90天内交付基础ADAS,并于同年12月交付高速NOA,奠定自研基础[10][44][45][46] - 数据积累从2021年前不足1亿公里快速增长至近年每年数亿公里,2023年有意控制数据采集量,聚焦高质量数据,当前保有量约十几亿公里,为模型训练提供支撑[34][35] 技术能力与资源投入 - 公司构建以数据闭环为核心的护城河,2023年“端到端”方案上线时通过“超级对齐”解决安全性问题,但过程痛苦,需核心团队持续数月每日早晨8点晨会[11][12] - 云端算力投入巨大,2023年约8 EFLOPS(对应10亿元人民币量级),当前训练算力达10 EFLOPS,推理算力3 EFLOPS,未来计划提升至32B参数模型,且投入不设上限[31][32][33] - VLA车端模型参数量为4B,通过工程优化部署至非大模型定制芯片;自研芯片将按AI需求设计,支持多芯片并联扩展算力,以应对存储带宽限制[23][33] 竞争对标与行业展望 - 公司认为与特斯拉FSD当前差距未拉开,但VLA加强化闭环实现自我迭代后,将形成代际优势,并有望凭借本土数据环境在中国市场超越特斯拉[39] - 针对特斯拉FSD V14,公司认可其表现(如修复95%犹豫变道问题),但指出其技术框架已包含Language模块,与VLA理念一致,双方路径趋同但实现细节不同[39][40] - 实现L4的最大挑战并非技术,而是大规模商业化落地,包括用户教育、法律法规和公众接受度;公司计划先聚焦国内市场,已设立创新业务部探索海外适配[40][41] 业务理念与领导力 - 公司坚持LSA(理想战略分析法)框架:认知决定战略、战略决定业务、业务决定组织与资源,强调在高峰时不膨胀、低谷时不放弃的长期执行力[52][53][54][62] - 研发高级副总裁将工作时间分配调整为50%管理、30%战略规划、20%技术业务,反映其从技术专家向业务管理者的转型,并深入参与L4商业化战略设计[58] - 公司培养人才注重全面业务理解,核心负责人需经历多岗位锻炼;校招生管理强调战略目标传达而非经验灌输,给予资源空间自主发挥[49][60]