Workflow
世界基座模型
icon
搜索文档
世界模型,是自动驾驶的终极答案吗?
36氪· 2026-02-05 12:30
行业核心趋势:世界模型成为智能驾驶新焦点 - 世界模型是继端到端、VLA后,智驾领域最时髦的技术名词,多家公司推出相关概念,如小鹏的“世界基座模型”、蔚来的“端到端世界模型”、华为的“世界行为模型”,地平线、理想、元戎启行、Momenta也在进行相关研发 [2] - 在广义语境中,世界模型本质是在虚拟世界再造真实世界,使AI能理解现实世界的物理规律、因果关系和环境动态,被科学家和科技公司视为实现“物理世界AI”的关键拼图 [3] - 当前智驾行业谈论的“世界模型”在技术路径上差异不大,主要是对传统仿真工具进行范式升级,旨在还原度、颗粒度、场景丰富度和自由度更高的虚拟世界中,解决端到端模型的测试与验证问题,以训练出更拟人化的智驾模型 [4] 技术驱动因素:端到端普及暴露传统仿真短板 - 过去两三年,头部智驾方案从规则栈转向AI驱动的端到端模型,感知、预测、规划被整合进一张网络,配合更大模型和更高算力,旨在使驾驶行为更拟人 [7] - 端到端模型的“黑盒”特性导致新版本OTA可能表现不稳定甚至“退步”,核心问题在于AI驱动使得模型评估和回归验证变得困难,研发人员难以定位错误原因 [8][9] - 端到端的普及凸显了传统仿真器的短板,传统仿真器在规则时代主要用于问题重现和增加特定场景数据,但无法支撑端到端模型所需的大规模、系统性闭环验证 [10] 核心应用定位:世界模型作为云端仿真与验证系统 - 截至目前,智驾行业的世界模型仅应用于云端,尚未部署到车端,其主要作用是充当仿真器,用于测试和验证端到端模型 [6] - 头部玩家如理想和小鹏均将世界模型作为仿真器应用,理想为使其VLA在仿真环境中进行强化学习,提出了包含自车和他车轨迹的驾驶世界模型;小鹏也在采用世界模型进行仿真测试以评测新算法 [10] - 世界模型在工程上被定位为端到端时代的“验证与反证系统”,用于在云端重放、改写、扩增现实驾驶场景,检验车端大模型输出的稳定性和可复现性,并形成可追踪的错误证据链 [14] - 世界模型的核心能力包括对物理世界的数字化建模与抽象,以及基于此对物理世界进行合理的想象和预测,例如通过给定图片预测未来变化 [14] 技术路径与挑战:生成质量、幻觉与算法瓶颈 - 世界模型的好坏取决于其能否在云端生成足够真实和多样性的数据,仅回放真实数据并非真正的世界模型,训练数据的质量会显著影响生成结果的质量 [15] - 世界模型底层是生成式模型,天生存在“幻觉”风险,目前最难的是保证生成内容符合真实世界的物理规律和行为逻辑,否则将导致车端模型学到错误知识,性能变差 [16] - 行业普遍处于早期阶段,国内厂商基于世界模型最长能生成30-60秒视频片段,但动态物体在时空一致性和多视角一致性上存在较大问题 [16] - 前理想汽车辅助驾驶负责人指出,世界模型的瓶颈首先在于算法层面未有突破,图像模型的自监督训练尚未找到像语言模型那样顺畅的范式,图像信息密度低,对驾驶决策有用的信息占比极低,模型需从海量噪声中提取极少有效信号 [17][18] - 由于基础技术尚未明确突破,车企对世界模型的投入更多是研究性质,目前世界模型主要停留在用于训练与验证的第一阶段,而非能支撑决策规划的第二阶段 [18] 效率价值与未来展望 - 基于世界模型,车企在云端仿真时可以无限制地生成所需场景,根据指令生成视频作为训练数据,效率远高于真实数据采集与训练,能带来模型迭代速度的断代式领先 [16] - 特斯拉采用了“世界模拟器”的概念,其基于海量数据集训练,根据当前状态与动作生成未来状态,并与车端端到端模型形成闭环评估,其方法更倾向于用神经网络“拟合”世界,渲染通过计算生成,以增强模型泛化能力 [11][14] - 业内观点认为,如果世界模型足够成熟且算力可支撑,未来有望部署到车端,实现通过预测世界变化并进行有利决策,从而解决自动驾驶和机器人相关问题,但目前尚无公司在车端应用世界模型 [18][19]
小鹏智驾一把手换人,蔚来团队大调整,各有各的算盘
36氪· 2025-10-10 20:30
小鹏汽车智驾负责人更迭 - 小鹏汽车自动驾驶中心负责人李力耘因身体原因暂时休息,不再担任该职务 [1][2] - 原世界基座模型负责人刘先明接任自动驾驶中心组织负责人,全面负责中心业务和组织管理工作,向何小鹏汇报 [2][3][9] - 刘先明于2024年3月加入小鹏汽车,担任AI团队负责人,入职仅一年多即晋升为智驾一号位 [6][8] - 刘先明博士毕业于伊利诺伊大学厄巴纳-香槟分校,曾在Facebook和Cruise任职,聚焦机器学习与计算机视觉领域 [6] - 小鹏汽车自动驾驶业务在5年内出现3次掌权人更迭,从吴新宙到李力耘,再到刘先明 [10][11][12] 小鹏汽车技术路线转向 - 公司官方回应指出,自动驾驶VLA大模型只是世界基座模型的应用,核心是让模型具备推演世界的能力 [13] - 刘先明此前为世界基座模型负责人,其晋升信号着小鹏将加速物理世界基座大模型在AI汽车领域的全面应用 [13] - 小鹏汽车于2024年4月提出“世界基座模型”路线,并在6月CVPR顶会上首次对外展示技术细节 [13] - 该世界模型参数规模高达720亿(72B),是行业主流VLA模型的35倍以上,训练数据超过2000万条视频片段(每条30秒) [14] - 公司认为“大算力 + 物理世界大模型 + 大数据”将定义未来AI汽车能力上限,该模型是走向L3、L4的基础 [13][16] 行业竞争与蔚来人事变动 - 蔚来智驾团队同期发生人事变动,世界模型负责人马宁宁、智驾产品负责人黄鑫等多位核心高管离职 [2][19] - 蔚来回应称此为主动组织架构调整,旨在构建新管理模式以全力冲刺世界模型2.0版本的开发与交付 [2][19] - 行业技术路线出现分岔,主流分为VLA(视觉-语言-动作)与世界模型(World Model + Action)两派 [17] - VLA路线的代表企业是理想和小鹏,世界模型路线的代表企业是华为和蔚来 [17] - 理想汽车上月亦调整自动驾驶团队,将智驾团队拆分为11个二级部门以推进AI大模型研发 [19] 小鹏智驾业务进展 - 李力耘在任期间带队完成了城市NGP在国内数百座城市落地,并推动“端到端”智驾方案在行车全功能量产上线 [12] - 刘先明加入小鹏后,其AI研究已同时为芯片、具身团队提供必要软件支持,显示出较强的业务能力 [7][8] - 小鹏世界基座模型未来将全面赋能公司AI体系全图谱,包括AI汽车、AI机器人、飞行汽车 [16]
独家丨小鹏汽车智驾一号位换帅,世界基座模型负责人刘先明接任
晚点Auto· 2025-10-09 22:52
小鹏汽车智驾团队人事变动 - 2024年10月9日,小鹏汽车自动驾驶中心负责人由李力耘变更为刘先明(Xianming Liu)[3] - 刘先明于2024年3月加入小鹏汽车,担任AI团队负责人,6月以小鹏世界基座模型负责人身份亮相,此前已直接向CEO何小鹏汇报[3] - 李力耘于2023年8月接替离职的吴新宙担任自动驾驶负责人,并于2024年10月晋升为公司副总裁[6] 新任负责人刘先明的背景与职责 - 刘先明2016年博士毕业于伊利诺伊大学厄巴纳-香槟分校电气和计算机工程专业,曾在Meta、Cruise从事机器学习与计算机视觉研究[3] - 其在小鹏从事的AI研究已同时为芯片、具身团队提供必要软件支持[4] - 公司将由其带领团队加速物理世界基座大模型在AI汽车领域应用,扩大智能辅助驾驶代际领先优势[6] 行业竞争格局与公司战略 - 2024年以来,理想、华为、蔚来等国产头部车企在智能驾驶领域竞争加剧,理想凭借"端到端+VLM"双系统方案跻身第一梯队[8] - 小鹏汽车将AI大模型作为技术研发重点,于2024年4月提出"基座模型"路线,内部开发一个720亿参数的自动驾驶大模型[8] - 公司已建成国内汽车行业首个万卡规模AI算力集群,2025年计划在AI和自动驾驶上投入45亿元[9] 公司技术进展与规划 - 李力耘在任期间带队完成了城市NGP在国内数百座城市落地,并推动小鹏实现"端到端"智驾方案在行车全功能量产上线[7] - 小鹏汽车将在下月年度AI科技日公布物理AI领域技术进展,涉及自研的AI基座模型,该模型研发历时一年多,使用了有史以来最大的模型数据量[8] - 自动驾驶VLA大模型是世界基座模型的一个重要应用,但更关键的是让模型具备对整个世界进行推演的能力[6]
工信部整顿智驾乱象;长城与宇树科技合作;小鹏披露“世界基座模型”进展;埃安滴滴L4 Robotaxi亮相 | 4月智驾热搜
中国汽车报网· 2025-04-27 09:48
文章核心观点 4月智能网联汽车领域发生多件大事,涵盖企业合作、融资、技术发布、政策推进等方面,对行业发展和格局产生重要影响 [1] 企业合作 - 地平线与大众汽车集团4月7日宣布在高阶智能驾驶领域基于HSD方案合作,通过合资公司酷睿程加速研发并落地大众车型,助力其在华智能化转型 [3] - 长城汽车4月8日与宇树科技签署协议,将在机器人技术等多领域合作,重点发力具身智能底层技术等,首期围绕“越野车+机器狗”融合探索场景 [4] - 蚂蚁集团、哈啰与宁德时代4月10日签署协议,围绕绿色智能出行等展开深度合作,将成立合资公司推进应用发展与商业化落地 [8] - 广汽埃安与滴滴在2025上海车展联合打造的L4级高度自动驾驶Robotaxi车型亮相,基于广汽埃安Y霸王龙打造,计划2025年底量产交付,2026年示范运营,2027年推面向个人用户的L4车型 [13] 企业融资 - 美国自动驾驶技术初创公司Nuro当地时间4月9日宣布在最新一轮融资中筹集到1.06亿美元,公司估值达60亿美元,由普信等投资 [5] - 国内智能底盘技术企业京西智行获深圳市投控基石新能源汽车产业基金5亿元战略投资,该基金规模达50亿元 [15] 企业动态 - 出行科技企业麦格纳4月9日在上海长宁区新办公室举行中国区新总部大楼启用仪式,庆祝入华二十周年,在华有近70家制造工厂、3万多名员工,2024年中国区业务增长15%,约60%销售额源自本土车企 [6] - Alphabet旗下自动驾驶子公司Waymo 4月11日宣布在东京启动地图数据采集计划,部署25辆捷豹I - PACE电动汽车测绘,后续开展有驾驶员的自动驾驶测试 [9] - 戴姆勒卡车北美公司4月16日宣布向子公司Torc Robotics交付基于第5代Freightliner Cascadia打造的最新旗舰测试卡车,支持自动驾驶,将在新路线测试 [14] 技术发布 - 深开鸿4月9日推出全国首个基于开源鸿蒙的分布式异构多机协同机器人操作系统M - Robots OS 1.0,硬实时响应低于1微秒,已在工业机械臂场景验证,将向多行业拓展 [7] - 小鹏汽车4月14日披露“世界基座模型”研发进展,参数规模达720亿,通过基座模型知识蒸馏技术将云端超大模型能力迁移至车端小模型,年内实现蒸馏模型上车 [10] 政策推进 - 4月16日工信部装备工业一司组织召开智能网联汽车产品准入及软件在线升级管理工作推进会,强调车企要领会通知要求,开展测试验证,明确功能边界和安全措施,不得虚假宣传,担负主体责任 [11] - 4月16日杭州市政府网站发布《杭州市智能网联车辆创新应用管理实施办法(征求意见稿)》,对L3级以上智能网联车辆及其监管工作作出规定,如L4级以上测试与应用人员配备等 [12] 行业要求 - 欧洲新车安全测试机构宣布自2026年1月起,强制要求送测新车配备指定物理按键,缺失将扣分,涵盖方向灯等按键 [16]