Workflow
RoadAGI
icon
搜索文档
元戎启行周光:智驾最终拼的是 AI 技术,不只是规模丨具身智能对话#13
晚点Auto· 2025-04-14 21:47
自动驾驶技术路线 - 行业存在多种技术路线实现无人驾驶,包括基于高精地图的RoboTaxi路线(Waymo、小马智行)和渐进式路线(特斯拉)[5] - 元戎启行提出新解法RoadAGI,借鉴大语言模型发展路径:从弱专家模型→通才→强专家模型,认为智驾系统也需要经历类似过程[5][6][8] - RoadAGI战略旨在打造移动能力的"通才"系统,可应用于汽车、摩托车、配送小车等多种移动终端,最终实现L5级自动驾驶[5][6][9] 技术范式迭代 - 智驾技术范式从Transformer到BEV再到端到端,主要由特斯拉引领,但特斯拉不再公布细节后行业出现技术路线分歧[6] - 元戎启行是行业少数坚持技术判断的公司,最早提出前融合、无高精地图、端到端等技术,目前是国内三家量产上车城市NOA的供应商之一[6] - 公司正在推进VLA模型(视觉-语言-动作模型),认为技术断代领先能带来商业机会[11] 行业竞争格局 - 2024年一季度特斯拉FSD进入中国市场,虽然不完全适应中国路况但基础能力强大[6][15] - 比亚迪、吉利等车企将智驾门槛拉低到10万元以下车型,打响普及战[6] - 有能力自研智驾的车企越来越少,多数选择与供应商合作,供应商经历洗牌后仅剩头部玩家[6] 公司发展策略 - 元戎启行当前量产车型达4万台,预计2024年将达20万台,认为10万与100万的数量级差距是1倍而非10倍[13] - 强调AI能力比规模更重要,认为L5五年内实现的概率不低,大模型方法将改变行业[15][16] - 工程能力与技术能力同等重要,通过首个量产项目建立了体系能力,现在可同时服务多个客户[11][12] 产品与技术理念 - RoadBrain是RoadAGI战略下的产品,作为移动能力的"通才"阶段,目标是实现不同终端1000公里接管一次,最终在汽车上实现10万公里接管一次[6][9] - 认为单一场景数据有限,需要自行车、摩托车等多终端数据丰富模型知识[9] - 下一代车端方案将是统一的数据驱动大模型,不同于传统端到端,符合大语言模型工艺但参数量适中[9] 行业趋势判断 - 特斯拉FSD V13在美国已达到"无接管意愿"水平,与Waymo差距缩小[15] - 华为是"点燃中国智驾之火"的公司,其无图方案的成功促使车企改变防守心态[15] - 智驾终局将趋于同质化,差异仅体现在驾驶风格偏好,但当前距离真正好用还有差距[15]
元戎启行周光:智驾最终拼的是 AI 技术,不只是规模丨具身智能对话#13
晚点LatePost· 2025-04-10 22:52
自动驾驶技术路线 - 行业存在多种技术路线实现无人驾驶 包括基于高精地图的RoboTaxi路线和特斯拉的渐进式路线 [2] - 元戎启行提出新解法RoadAGI 借鉴大语言模型发展路径 从弱专家到通才再到强专家模型 [2][3] - RoadAGI旨在打造移动能力通才系统 可应用于汽车/摩托车/配送小车等多种终端 为L5级自动驾驶奠定基础 [3][5] 技术演进与创新 - 智驾技术范式经历多次迭代 从Transformer到BEV再到端到端 特斯拉曾是主要引领者 [3] - 元戎启行率先采用前融合/无高精地图/端到端/VLA等新技术范式 是国内三家量产城市NOA的供应商之一 [3] - 通才模型通过多终端数据训练 可实现能力跃迁 如1000公里接管的通才系统在汽车上可能达到10万公里接管 [6] 行业竞争格局 - 特斯拉FSD进入中国市场 虽未完全本地化但基础能力强大 国内智驾水平相当于FSD V12阶段 [12] - 比亚迪/吉利等车企将智驾门槛降至10万元以下 多数车企选择与供应商合作 二线供应商已遭淘汰 [3] - 当前量产车辆达4万台 预计2024年提升至20万台 数量级差异对数据收集的影响呈对数关系而非线性 [10] 工程与商业化 - 工程能力与技术能力同等重要 元戎启行通过首个量产项目建立体系 接单效率从30人/项目提升至10人/项目 [9] - 供应商需平衡技术迭代与客户服务 元戎启行目标在实现L5基础上发展物理世界通用AI 而非单纯追求规模 [12][13] - 车企与供应商数据共享形成共赢 模型迭代可提升产品效果促进销售 [11] 未来发展方向 - L5级自动驾驶被视为可实现目标 大模型方法出现后五年内落地概率显著提升 [12] - 终局阶段智驾差异化将减弱 核心是提供符合用户偏好的"司机"体验 但当前技术距真正好用仍有差距 [12] - 物理通用人工智能(AGI)成为更长期愿景 超越单一自动驾驶范畴 [15]
对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025
量子位· 2025-03-21 14:37
RoadAGI战略与概念 - 提出RoadAGI作为实现垂直道路场景AGI的新路径 通过AI Spark平台赋能智能车、机器人等移动体实现自主移动[1][2][8] - RoadAGI本质是基于AI的通勤能力 实现从店铺取货到最终配送的完整闭环 包括识别环境、过闸机、乘电梯等复杂场景[5][6][7][26] - 与传统无人配送存在本质区别:不依赖高精地图 通过视觉语言动作模型(VLA)实现免部署 只要人能到达的地方RoadAGI即可通过自主推理到达[10][27][28] 技术架构与优势 - 核心采用视觉语言动作模型(VLA) 将道路图像信息和文本指示融合处理 输出驾驶行为和文字 打通空间智能、语言智能和行为智能[11][13][14] - 技术底座基于端到端架构 预计2025年年中量产上车 已获得理想汽车等行业头部响应[11][12] - 具备大规模量产数据闭环能力 经过4000万公里智驾数据积累 形成显著技术先发优势[22][55][66] 商业化路径 - 首选落地场景为外卖配送 硬件成本约1-2万元 利用汽车供应链实现低成本规模化[49][57] - 目标替代数千万骑手市场 相比L5级自动驾驶具有更高容错率和更快商业化前景[51][65] - 去年智驾量产车型上市后成为爆款 单款车型获取城区NOA市场15%份额 今年预计交付超过20万台车[20][76] 公司战略定位 - 公司定位为AI公司而非单纯智驾公司 智驾只是实现物理AI的商业化选择[19][69] - RoadAGI是技术能力的自然延伸 与现有智驾业务高度协同 只需更换数据集无需分散兵力[45][47][54] - 目标成为中国第一家实现物理AI的公司 最终通过打通物理AI、生成式AI和语言AI实现真正AGI[81][84][86] 行业竞争格局 - 认为FSD在华基础能力领先国内一代 动态交互博弈能力突出 但受限于数据水土不服[94][95][97] - 激光雷达必要性随AI能力提升而降低 纯视觉方案在OCC网络成熟下可达97分效果 与激光雷达融合增益仅为1-2%[112][113] - 智驾行业已进入淘汰赛 城区NOA当前存在技术门槛但3-5年后或趋于平权 主机厂自研能力提升加速行业洗牌[107][109] 技术发展观点 - 认为选择比努力重要 在技术高速变化期应优先把握架构方向而非单纯解决问题[116][118][119] - VLA模型成熟度尚未完全成熟 但已支撑RoadAGI可行性 后续需持续迭代优化[39][61][62] - 物理AI与具身智能不冲突 公司专注高等级规划与大脑开发 而非底层运动控制[34][43]