Workflow
端到端智驾方案
icon
搜索文档
对话郎咸朋:VLA 技术论战、团队换血与不被看好时的自我证明
理想TOP2· 2025-11-05 18:29
公司战略与技术路线 - 公司认为无法在竞争对手已建立的战场上取胜,必须通过开辟新战场实现超越,例如在技术路线上选择研发下一代“端到端”和VLA模型 [5][13][16][17] - 公司自动驾驶业务发展有明确时间节点:2021年确认核心技术方案,2023年拿到入场券,2025年成为顶级公司,2027年实现L4常态化运营 [43] - 公司战略核心是高效运营数据闭环,其能力发展公式为 I' = A · D(t) · δ(t),其中算法能力A是常量,有效数据量D(t)趋于稳定,数据闭环效率δ(t)是关键变量 [60][61] 技术演进与核心决策 - 2023年底至2024年初,公司决定必须实现智能化超越,选择以“端到端”技术作为对传统规则方案的代际提升,并于去年下半年取得成果 [16] - 2024年春节前后,公司认识到“端到端”模仿学习存在天花板,如跟慢车不绕行、复杂路口理解不足等问题,因此加速转向VLA模型研发 [18] - VLA模型旨在让系统具备类似人类的思考推理能力,其内部代号为“斯芬克斯”,公司目标是使其成为实现L4级自动驾驶的路径 [20][21][30] 组织架构与运营模式 - 公司于9月19日将智驾团队重组为11个二级部门,使组织架构更为扁平,旨在打造面向AI的团队,提升决策效率并取消大规模封闭研发模式 [6][7] - 公司调整研发节奏,取消集中封闭开发,因时代背景从追赶变为领先,需要各部门发挥业务专长,并体现对员工的关怀 [9] - 公司智驾团队骨干已演进至第三代,核心管理者和二级部门负责人均从内部培养,强调对全面业务的了解 [52][53][54] 数据与算力基础设施 - 公司目前拥有10 EFLOPS训练算力加3 EFLOPS推理算力,去年云端算力投入约10亿元人民币量级,达到8 EFLOPS,并表示在算力方面投入不设限 [35][37][38] - 公司数据量从2021年前不足1亿公里,增长至去年有意控制下仍有十几亿公里高质量数据,未来将依靠世界模型生成更多数据用于训练 [40][41] - VLA车端模型参数量为4B,计划将云端模型做到32B,公司通过工程优化能力将模型部署在非大模型定制的芯片上 [39][40] 技术对比与行业竞争 - 公司回应了博世和华为对VLA技术的质疑,认为多模态对齐、数据训练和模型幻觉问题可通过自身技术积累解决,并称反对声音恰恰说明VLA正确 [23][24][25] - 公司认为其世界模型是为VLA模型服务的强化训练环境,与蔚来、华为对世界模型的理解不同,并与Yann LeCun提出的可预测未来状态的理念一致 [31][32][33] - 公司与特斯拉FSD的差距尚未拉开,但预计在VLA加强化闭环实现自我迭代后,将形成代际差别,并可能在中国市场超过特斯拉 [44] 商业化落地与未来挑战 - 公司认为实现L4级自动驾驶的最大挑战并非技术,而是大规模商业化落地,包括用户教育、法律法规和公众接受程度,初期将聚焦国内市场 [45][46][47] - 公司计划到2026年底实现1000公里的平均接管里程,之后该指标可能不再适用,业务模式将因强化训练闭环而发生根本性变革 [42] - 公司已建立面向海外市场的创新业务部,进行产品交付和L4落地预研,但承认海外市场的法规和产品设计与国内存在区别 [47]
理想郎咸朋:VLA 加强化学习将成为车企真正的护城河
晚点LatePost· 2025-11-04 16:03
公司战略与技术路线 - 公司认为无法在竞争对手已建立的规则方案战场上取胜,必须开辟新战场,通过技术代际提升实现超越 [13][14][16] - 公司自动驾驶发展遵循明确时间节点:2021年确认技术方案,2023年拿到入场券,2025年成为顶级公司,2027年实现L4常态化运营 [41] - 公司战略从跟随转向引领,2023年底至2024年初资源充足后,目标变为在智能化上显著超越华为 [16] - 技术路线经历三次重大演变:从规则方案到端到端模型,再到当前的视觉-语言-行动模型,每次转变都是为了建立新竞争优势 [5][16][18] 视觉-语言-行动模型技术 - VLA模型旨在让自动驾驶系统具备类似人类的思考推理能力,而非单纯模仿驾驶行为,项目代号为“斯芬克斯” [5][21] - 公司认为VLA结合强化学习将形成新的护城河,并演化成未来企业走向人工智能的护城河 [6] - 针对外界对VLA多模态对齐、数据训练、模型幻觉和芯片适配的质疑,公司回应称已具备相关能力积累,现有数据量达十几亿公里 [21][24][39] - VLA车端模型参数量为40亿,云端模型目标为320亿,公司认为驾驶任务不需要像GPT-3那样1750亿的超大模型 [37] 组织架构与团队管理 - 公司近期将智驾团队重组为11个二级部门,部门负责人直接向研发高级副总裁汇报,旨在打造更扁平、高效的AI组织 [8][9] - 团队发展已历经三代骨干更替,核心管理者和技术负责人均从内部培养成长 [52] - 公司宣布取消大规模封闭研发模式,转向各部门发挥业务专长共同协作,体现对员工的关怀和管理思路转变 [10] - 团队规模控制在千人左右,坚持精兵策略,认为数据闭环和强化训练闭环成熟后无需数千人团队 [60][61] 数据与算力基础设施 - 公司认为自动驾驶的本质是高效运营数据闭环,其能力公式为有效驾驶区域 = 算法能力 × 有效数据量 × 数据闭环效率 [42][58][59] - 公司累计数据量从2021年前不到1亿公里,发展到如今十几亿公里,并有意识采集高质量数据而非盲目追求数据量 [39] - 公司当前云端算力为100亿亿次浮点运算的训练算力加30亿亿次浮点运算的推理算力,去年投入约10亿元人民币达到80亿亿次浮点运算算力 [33][36] - 算力投入不设上限,未来训练与推理算力预计各占一半,最终将收敛到合理数值 [33][34][35] 技术演进与行业竞争 - 端到端模型在2023年量产落地,解决了跟随慢车不绕行、复杂路口看不懂红绿灯等长尾问题,使公司跻身智驾第一梯队 [12][16][19] - 公司认为端到端模仿学习存在天花板,今年春节后资源加速向VLA倾斜,目标是实现L4级自动驾驶 [19][20] - 针对特斯拉FSD进入中国,公司认为双方目前差距尚未拉开,但VLA强化闭环实现自我迭代后将形成代际差别,有望在中国市场超越特斯拉 [44] - 公司观察到特斯拉最新FSD版本也已引入语言模块和多模态任务,与VLA理念高度一致,双方技术路径方向一致但实现细节不同 [44][45] 研发历程与关键节点 - 公司智驾自研起步于2021年的“卫城”项目,团队不足100人,用90天交付基础辅助驾驶功能,完成从0到1的突破 [11][49][51] - 研发过程中曾经历高强度封闭开发,例如为交付端到端1000万片段版本,核心团队持续两三个月每天早晨8点开晨会 [12] - 2019年资源极度匮乏时期,团队曾使用碰撞测试报废车辆安装价值300多万元的激光雷达进行技术预研 [54] - 从2021年交付基础辅助驾驶到2023年实现城市导航辅助驾驶,公司通过连续封闭开发完成了关键功能追赶 [10][15]
对话郎咸朋:VLA 技术论战、团队换血与不被看好时的自我证明
晚点Auto· 2025-11-04 11:58
技术战略与路线选择 - 公司认为无法通过模仿领先者(如华为)的方式实现超越,必须开辟新的技术战场,因此选择研发下一代技术如“端到端”和VLA(视觉-语言-行动模型)以实现代际提升[3][13][16][17] - 2023年底公司决定从规则方案转向“端到端”架构,使智驾能力进入第一梯队;2024年初进一步选择VLA路径,目标是让系统具备类似人类的推理能力,而非单纯行为模仿,以争取成为没有争议的行业第一[3][16][19] - VLA被视为实现L4级自动驾驶的关键路径,其核心优势在于无监督训练和更高的迭代效率,预计最晚明年初用户可体验到显著提升;公司认为反对声音恰恰验证了VLA方向的正确性[3][18][23][24] 组织架构与团队演进 - 2024年9月公司对智驾团队进行重组,将原有4-5个二级部门拆分为11个部门,负责人直接向研发高级副总裁汇报,旨在打造更扁平的AI组织以提升决策效率和适应性[6][7][8] - 团队自2018年成立以来已更换三代骨干,早期成员多因资源投入分歧离职;当前核心管理层强调从内部培养,二级部门负责人均具备业务和技术背景,而非纯管理出身[8][46][47][49] - 公司取消大规模封闭研发模式,转向各部门发挥专长共同协作,反映其从追赶者到领先者的角色转变,同时注重员工关怀与可持续能力建设而非单纯压榨工时[8][9] 研发历程与关键节点 - 自研起步阶段(2019年)资源极度匮乏,团队曾使用碰撞测试报废车辆安装激光雷达进行预研,单个激光雷达成本达60-80万元,总投入约300余万元[3][50] - 2021年启动首个全栈自研项目“卫城”,团队不足100人,通过连续封闭开发(如每天全员到岗、凌晨加班)在90天内交付基础ADAS,并于同年12月交付高速NOA,奠定自研基础[10][44][45][46] - 数据积累从2021年前不足1亿公里快速增长至近年每年数亿公里,2023年有意控制数据采集量,聚焦高质量数据,当前保有量约十几亿公里,为模型训练提供支撑[34][35] 技术能力与资源投入 - 公司构建以数据闭环为核心的护城河,2023年“端到端”方案上线时通过“超级对齐”解决安全性问题,但过程痛苦,需核心团队持续数月每日早晨8点晨会[11][12] - 云端算力投入巨大,2023年约8 EFLOPS(对应10亿元人民币量级),当前训练算力达10 EFLOPS,推理算力3 EFLOPS,未来计划提升至32B参数模型,且投入不设上限[31][32][33] - VLA车端模型参数量为4B,通过工程优化部署至非大模型定制芯片;自研芯片将按AI需求设计,支持多芯片并联扩展算力,以应对存储带宽限制[23][33] 竞争对标与行业展望 - 公司认为与特斯拉FSD当前差距未拉开,但VLA加强化闭环实现自我迭代后,将形成代际优势,并有望凭借本土数据环境在中国市场超越特斯拉[39] - 针对特斯拉FSD V14,公司认可其表现(如修复95%犹豫变道问题),但指出其技术框架已包含Language模块,与VLA理念一致,双方路径趋同但实现细节不同[39][40] - 实现L4的最大挑战并非技术,而是大规模商业化落地,包括用户教育、法律法规和公众接受度;公司计划先聚焦国内市场,已设立创新业务部探索海外适配[40][41] 业务理念与领导力 - 公司坚持LSA(理想战略分析法)框架:认知决定战略、战略决定业务、业务决定组织与资源,强调在高峰时不膨胀、低谷时不放弃的长期执行力[52][53][54][62] - 研发高级副总裁将工作时间分配调整为50%管理、30%战略规划、20%技术业务,反映其从技术专家向业务管理者的转型,并深入参与L4商业化战略设计[58] - 公司培养人才注重全面业务理解,核心负责人需经历多岗位锻炼;校招生管理强调战略目标传达而非经验灌输,给予资源空间自主发挥[49][60]
晚点独家丨蔚来智驾再调整:任少卿直管大模型部门,推进 “端到端” 量产交付
晚点LatePost· 2024-12-24 20:53
蔚来智驾团队人事调整 - 蔚来智能驾驶研发团队近期完成多个重要岗位人事变动,涉及大模型部、部署架构与方案部、时空信息部负责人调整[5] - 智能驾驶研发副总裁任少卿将直管大模型部,陈昆盛接任部署架构与方案部负责人,时空信息部由张红霞接管[5] - 被替换的彭超、秦海龙将改任方案负责人,组成虚拟战队负责交付[5] - 人工智能平台负责人白宇利职位不变[6] 组织架构调整目的 - 调整目的是确保先进功能更好交付用户,满足多平台、多功能业务需求,应对技术和产品快速变化[6] - 智驾部门将分为技术委员会、资源、方案三部分,方案负责人不直接带团队但可参与成员绩效评定[6] - 技术委员会将作为中台加强平台易用性和稳定性[6] - 调整后架构为"战备架构",旨在提高智驾方案量产交付速度[6] 端到端智驾研发进展 - 蔚来尚未向用户全量推送"端到端"智驾方案,7月实现基于该算法的主动安全功能上车[6] - 公司计划在Banyan 3.1.0版本中新增基于大模型架构的自动紧急避让AES功能[6] - 白宇利表示"端到端"不是一夜之间能完成的任务,需足够大数据量和算力支持[7] - 任少卿透露蔚来世界模型NIO WorldModel已开发一年,能推演216种交通场景[7] 技术优势与人才储备 - 蔚来第二代车型NT2.0平台总算力达1016 TOPS,是理想和小鹏高阶智驾版本两倍[8] - 截至去年9月云端算力集群规模为1.4 EFlops,并行训练加速比达91%以上[8] - 智驾部门人才密度高于多数国产车企,多位技术主管来自Momenta[7] - ET9被定义为"十年技术结晶",具备七重冗余,李斌称其智驾水准全球领先[7] 行业竞争态势 - 特斯拉FSD V12率先采用"端到端"架构,国内理想、小鹏及华为等已完成全量推送[6] - 蔚来将成为国内第三家推出AES功能的公司,前两家为理想和华为[6] - 公司2016年启动智能驾驶自研,2020年首家量产高速NOA功能的国产车企[6]