AI司机

搜索文档
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解:AI「吃」下6亿秒视频后,智能涌现
量子位· 2025-06-16 12:50
核心观点 - 小鹏汽车在CVPR 2025上首次验证了Scaling Law在自动驾驶VLA模型上的有效性,展示了其"自动驾驶基座模型"的技术突破[1][46] - 公司通过720亿参数的云端VLA大模型+车端蒸馏小模型架构,实现了无规则代码托底的纯AI司机能力,决策丝滑度显著超越传统方案[4][30][42] - 新技术路线突破L2端到端局限,以"世界模型+强化学习"构建具备链式思考(CoT)能力的AI驾驶系统[18][38][40] - 量产车G7搭载3颗自研图灵AI芯片(2200TOPS),成为首款实现"VLM大脑+VLA小脑"架构的L3级AI汽车[22][53][55] 技术架构 - **云端基座模型**:720亿参数VLA大模型,骨干网络采用LLM架构,已训练2000万条30秒视频片段,验证Scaling Law效应[30][43][46] - **车端部署**:通过知识蒸馏将云端能力迁移至车端小模型,解决直接训练小模型的模态坍塌问题,实现5天/次迭代周期[42][46][47] - **世界模型**:开发中的实时建模系统可生成corner case训练数据,模拟智能体博弈行为,强化基座模型能力[39][40] - **芯片算力**:自研图灵AI芯片单颗等效3颗主流芯片,G7搭载3颗达2200TOPS,超算集群达10 EFLOPS(效率90%)[50][51][53] 能力验证 - **无规则驾驶**:完全依赖基座模型完成加减速、变道绕行、红绿灯等待等任务,无紧急避险动作[4][7][14] - **复杂场景**:成功通过福州特殊路口(两树间车道)、雨天窄路违停绕行、施工区突遇汇入货车等极端场景[15][17][11] - **决策优势**:相较传统方案(触发急刹概率高),新系统在目标距离/速度临界区间仍保持丝滑通过率[15][17] 行业突破 - **技术路线**:首创"云端大模型+车端蒸馏"架构,突破L2端到端黑箱局限,实现可解释的链式思考能力[23][26][60] - **量产应用**:G7成为行业首款搭载VLM(车辆大脑)+VLA(运动小脑)的量产车,定义AI汽车新标准[55][56][57] - **通用能力**:技术体系已扩展至机器人、飞行汽车领域,形成具身智能统一解决方案[64][65] 数据表现 - 训练数据量达2000万条30秒视频片段[43] - 云端模型参数量720亿,车端模型通过蒸馏实现能力迁移[30][42] - 超算集群算力10 EFLOPS,迭代周期5天/次[50] - 量产车G7算力2200TOPS(3颗自研芯片)[53]
Scaling Law首次在自动驾驶赛道被验证!小鹏汽车CVPR演讲详解:AI「吃」下6亿秒视频后,智能涌现
量子位· 2025-06-16 12:49
核心观点 - 小鹏汽车在CVPR 2025上首次验证了Scaling Law在自动驾驶VLA模型上的有效性,展示了其"自动驾驶基座模型"的技术突破[1][43][46] - 公司通过云端大模型+车端小模型蒸馏的技术路线,实现了AI司机的"智能涌现",在复杂场景下表现出超越传统方案的决策能力[4][7][9][11][13][14] - 新技术路线突破了传统端到端方案的局限性,构建了具备完整认知能力的"大脑+小脑"架构,为自动驾驶和具身智能的大一统奠定基础[26][27][57][60] 技术方案 - 云端部署720亿参数VLA大模型,以语言模型为骨干网络,融合视觉、语言和动作模块,实现环境理解到行为输出的闭环决策[30][33][36] - 车端部署蒸馏后的小模型,通过持续在线学习(Online Learning)实现能力迭代,G7车型搭载3颗自研图灵AI芯片,算力达2200TOPS[42][53][55] - 强化学习训练聚焦安全、效率、合规三大原则,并开发世界模型(World Model)生成高价值训练数据[37][38][39][40] 性能表现 - 在无规则代码托底情况下,基座模型直接控车完成加减速、变道绕行、转弯掉头等复杂驾驶任务,决策丝滑度显著优于传统方案[4][5][14][15] - 成功通过福州特殊路口等极端场景,展现出链式思考能力(CoT)和全局理解能力[17][18] - 模型累计训练2000多万条30秒视频片段,参数规模与数据量扩大过程中持续显现Scaling Law效应[43][46] 行业影响 - 首次从技术层面回应了"端到端只能模仿不能超越"的行业质疑,为L2与L4的技术路线融合提供新思路[27][60] - 云端算力达10 EFLOPS,集群效率超90%,全链路迭代周期5天,水平媲美顶尖AI公司[50][51] - 技术体系已实现车、机器人和飞行汽车通用,推动"AI定义汽车"向具身智能延伸[62][63][64] 产品落地 - 最新SUV G7预售价23.58万,成为量产L3级AI算力第一车,采用无激光雷达方案[2][15] - VLM作为车辆"大脑"统一舱驾交互,VLA-OL模型增强"小脑"运动规划能力[55][56] - 公司从2024年开始全面转向新技术路线,与行业主流方案形成明显差异[23][50]