Workflow
VLA技术
icon
搜索文档
对话郎咸朋:VLA 技术论战、团队换血与不被看好时的自我证明
理想TOP2· 2025-11-05 18:29
以下文章来源于晚点Auto ,作者晚点团队 晚点Auto . 从制造到创造,从不可能到可能。《晚点LatePost》旗下汽车品牌。 本文经授权转自《晚点AUTO》 作者:赵宇 编辑:龚方毅 黄俊杰 42 岁之前,郎咸朋从不抽烟,但在去年夏天理想研发 "端到端" 智驾方案期间,他每个工作日都得 来上两根。 技术的演进常伴随争议,而最终消解争议的仍是产品本身。郎咸朋认为,相比有监督训练的 "端到 端",无监督训练的 VLA 迭代效率更高,最晚到明年初,外界就能看到明显提升。 相比我们此前两次交流(一年前推出 "端到端" 方案,以及两个月前 VLA 临近落地),郎咸朋这次更松 弛一些,近三个小时的谈话中,他语速平稳、声音轻快。谈及理想智驾的进展和技术选择,他的用词也 更笃定。 见面前不久,理想智驾团队又经历了新一轮架构调整和人员变动。这个 2018 年成立的团队已经换了三 代骨干。作为理想智驾第一号员工,郎咸朋向我们完整回顾了团队的发展演变历程,他加入理想以来的 工作理念和方法,并首次回应了外界对理想新技术的质疑。 以下是访谈及少量追加问答的主要内容,经编辑。灰色引用模块则是我们做的信息补充: 不可能用华为的方式打 ...
何小鹏:为搞AI“烧掉”20多亿,曾“每月花1个多亿”
凤凰网· 2025-11-05 15:46
何小鹏坦言,这项研发投入巨大,"烧了二十多个亿的训练费用" 。他描述这一过程充满挑战,因为在 很长时间里"一直都没有看到任何的希望",研发团队内部甚至"多次讨论要不要把这个VLA的团队项目 给干掉"。 凤凰网科技讯(作者/于雷)11月5日, 在2025小鹏科技日上,小鹏汽车CEO何小鹏披露了公司在AI及 自动驾驶大模型研发上的巨额投入。何小鹏表示,为了探索创新的VLA技术路线,小鹏汽车从2024年 至今,已投入了3万卡的算力。 据何小鹏透露,VLA项目的训练费用高昂,"每个月付的账单" 带来了巨大压力,甚至出现过"这个月又 花了一个多亿的训练费用"的情况。 何小鹏称,直到今年的二季度 ,这个基于物理世界模型、跳过语言环节的创新VLA方案才突然取得了 技术突破。这一突破促使小鹏汽车决定停止标准VLA方案的开发,全力转向新技术。何小鹏认为,这 一进展将小鹏的自动驾驶升级换代"提前了接近两年"。 ...
对话郎咸朋:VLA 技术论战、团队换血与不被看好时的自我证明
晚点Auto· 2025-11-04 11:58
技术战略与路线选择 - 公司认为无法通过模仿领先者(如华为)的方式实现超越,必须开辟新的技术战场,因此选择研发下一代技术如“端到端”和VLA(视觉-语言-行动模型)以实现代际提升[3][13][16][17] - 2023年底公司决定从规则方案转向“端到端”架构,使智驾能力进入第一梯队;2024年初进一步选择VLA路径,目标是让系统具备类似人类的推理能力,而非单纯行为模仿,以争取成为没有争议的行业第一[3][16][19] - VLA被视为实现L4级自动驾驶的关键路径,其核心优势在于无监督训练和更高的迭代效率,预计最晚明年初用户可体验到显著提升;公司认为反对声音恰恰验证了VLA方向的正确性[3][18][23][24] 组织架构与团队演进 - 2024年9月公司对智驾团队进行重组,将原有4-5个二级部门拆分为11个部门,负责人直接向研发高级副总裁汇报,旨在打造更扁平的AI组织以提升决策效率和适应性[6][7][8] - 团队自2018年成立以来已更换三代骨干,早期成员多因资源投入分歧离职;当前核心管理层强调从内部培养,二级部门负责人均具备业务和技术背景,而非纯管理出身[8][46][47][49] - 公司取消大规模封闭研发模式,转向各部门发挥专长共同协作,反映其从追赶者到领先者的角色转变,同时注重员工关怀与可持续能力建设而非单纯压榨工时[8][9] 研发历程与关键节点 - 自研起步阶段(2019年)资源极度匮乏,团队曾使用碰撞测试报废车辆安装激光雷达进行预研,单个激光雷达成本达60-80万元,总投入约300余万元[3][50] - 2021年启动首个全栈自研项目“卫城”,团队不足100人,通过连续封闭开发(如每天全员到岗、凌晨加班)在90天内交付基础ADAS,并于同年12月交付高速NOA,奠定自研基础[10][44][45][46] - 数据积累从2021年前不足1亿公里快速增长至近年每年数亿公里,2023年有意控制数据采集量,聚焦高质量数据,当前保有量约十几亿公里,为模型训练提供支撑[34][35] 技术能力与资源投入 - 公司构建以数据闭环为核心的护城河,2023年“端到端”方案上线时通过“超级对齐”解决安全性问题,但过程痛苦,需核心团队持续数月每日早晨8点晨会[11][12] - 云端算力投入巨大,2023年约8 EFLOPS(对应10亿元人民币量级),当前训练算力达10 EFLOPS,推理算力3 EFLOPS,未来计划提升至32B参数模型,且投入不设上限[31][32][33] - VLA车端模型参数量为4B,通过工程优化部署至非大模型定制芯片;自研芯片将按AI需求设计,支持多芯片并联扩展算力,以应对存储带宽限制[23][33] 竞争对标与行业展望 - 公司认为与特斯拉FSD当前差距未拉开,但VLA加强化闭环实现自我迭代后,将形成代际优势,并有望凭借本土数据环境在中国市场超越特斯拉[39] - 针对特斯拉FSD V14,公司认可其表现(如修复95%犹豫变道问题),但指出其技术框架已包含Language模块,与VLA理念一致,双方路径趋同但实现细节不同[39][40] - 实现L4的最大挑战并非技术,而是大规模商业化落地,包括用户教育、法律法规和公众接受度;公司计划先聚焦国内市场,已设立创新业务部探索海外适配[40][41] 业务理念与领导力 - 公司坚持LSA(理想战略分析法)框架:认知决定战略、战略决定业务、业务决定组织与资源,强调在高峰时不膨胀、低谷时不放弃的长期执行力[52][53][54][62] - 研发高级副总裁将工作时间分配调整为50%管理、30%战略规划、20%技术业务,反映其从技术专家向业务管理者的转型,并深入参与L4商业化战略设计[58] - 公司培养人才注重全面业务理解,核心负责人需经历多岗位锻炼;校招生管理强调战略目标传达而非经验灌输,给予资源空间自主发挥[49][60]