第二代VLA模型
搜索文档
当AI走出屏幕,小鹏亮出物理AI这张牌
钛媒体APP· 2025-11-10 19:14
行业趋势共识 - AI发展正从虚拟世界转向物理世界,物理AI成为科技巨头必争的新战场[2][3] - 行业领袖如英伟达黄仁勋和阿里巴巴吴泳铭均认为AI正从生成式、代理式迈向物理AI时代,其核心是AI能直接从物理世界获取数据并自主学习迭代[4] 主要参与者与战略路径 - 特斯拉和小鹏等公司选择垂直整合模式,自研芯片、传感器、软件及整车制造以掌握核心命脉[5] - 特斯拉凭借全自研FSD芯片和视觉算法构建护城河,小鹏则通过自研图灵AI芯片、第二代VLA模型及云端算力集群,将能力复用于飞行汽车和机器人[5] - 英伟达、华为等公司扮演生态赋能者角色,英伟达依靠Blackwell GPU系列和Cosmos平台构建算力帝国,华为聚焦超节点互联以支撑大规模算力[5] - Waymo和百度Apollo等公司长期专注于攻克Robotaxi这一高阶完全无人驾驶场景,以证明物理AI的终极可能性[6] 小鹏公司的核心技术体系 - 小鹏第二代VLA模型实现从视觉信号到控制指令的端到端闭环,避免了传统模型需将画面转为语言描述的信息丢失环节,反应更快且能更直接学习物理规律[9] - 通过自研图灵AI芯片和软硬件优化,将车端算力推高至2250TOPS,远超行业水平,使搭载数十亿参数大模型成为可能,而其他车企通常只能运行千万级参数模型[10] - 云端由近3万张GPU卡组成的算力集群持续对模型进行训练和优化[10] 小鹏公司的多场景商业化落地 - 计划于2026年推出的Robotaxi为前装量产车,不依赖激光雷达和高精地图,凭借纯视觉和二代VLA能力实现不限区域运营,旨在解决成本高、范围小、体验差痛点[11] - 人形机器人IRON被赋予思考能力,目标是从实验室展示品转变为能从事商场导览、工厂巡检等工作的商业工具[13] - 飞行汽车领域,陆地航母已获得7000台订单并进入试产阶段,A868模型共同构成低空出行布局[15] - Robotaxi、智能汽车、人形机器人与飞行汽车四大场景构成物理AI能力逐级攀登、验证与复用的能力阶梯,其高环境复杂性和安全要求能迫使模型发展出更高稳健性[15] 行业核心挑战与竞争关键 - 物理AI面临两大核心挑战:获取高质量数据燃料和构建共赢产业生态[19] - 数据价值在于质量而非数量,关键在于捕获长尾和异常数据以持续反哺模型,因此多场景落地是获取独特数据矿场的战略[21] - 小鹏采取核心自控、生态开放策略,在芯片、模型、数据闭环等核心环节坚持自研,同时将Robotaxi能力以工具箱形式开放给高德等伙伴,并在机器人、芯片架构上寻求合作[21][22] - 竞争本质是让技术转化为普通人愿意购买且放心使用的产品,目前尚无企业完全攻克所有难关,行业正处于产品落地的深水区[22]
小鹏,“重拾”执念
虎嗅APP· 2025-11-10 11:44
文章核心观点 - 小鹏汽车通过科技日活动发布新一代人形机器人IRON引发广泛关注但机器人业务仍处于早期阶段存在较大不确定性[2][4][6][7][17] - 公司战略重心从AI汽车公司升级为具身智能公司但机器人低空飞行等新业务与主营业务的协同及商业化路径尚不清晰[43][42][24][25] - 智驾技术推出第二代VLA模型通过端到端架构提升性能并计划2026年推出Robotaxi但实际效果需待实测验证[29][30][34] IRON机器人技术细节 - 硬件层面采用复杂机械结构肩部腰部胯部自由度相比4月工程版提升一个数量级通过增加机械结构优化电机布局[10][13][14] - 软件层面嵌入生成式大模型实现端到端动作生成搭载3颗图灵芯片算力达2250TOPS可根据意图自主生成运动而非预设指令[14][15] - 步态展示柔和肩颈舒展自然胯部摆动流畅转身能力因硬件升级与算法结合引发真人套壳质疑公司通过剪开皮肤肌肉自证[6][10][14] 机器人商业化路径 - 应用场景从工厂打螺丝门店服务调整为导览导购导巡等低复杂度场景因灵巧手采用谐波电机方案寿命与维护问题未解决[18][20][22] - 量产时间定于2026年底但具体规模用途落地存在疑问业务方向频繁调整反映资源分配与长期路径的不确定性[17][23][24] - 公司明确否定工厂与家庭场景的近期可行性强调通过试点场景收集数据驱动能力提升但优先级低于主营业务[18][23] 低空经济业务进展 - 宣布陆地航母进入量产前夜并发布新机型A868采用全倾转构型目标航程500km最高航速360公里/小时[25][26] - 计划在敦煌推出低空自驾旅游线但参考亿航等企业类似项目多未能持续商业化运行低空业务商业化前景不明[25] - A868机型仍为展示模型需3-5年完成认证适航流程当前阶段难以对业绩产生实质贡献[27] 智驾技术升级 - 第二代VLA模型采用端到端架构减少文本中介依赖提升数据利用效率实现隐式推理支持本地化低延时高帧率处理[30][31] - 技术突破源于算力提升后重构底层模型放弃第一代并行路线成果通过持续投入涌现但细节未公开避免行业竞争[31][33][34] - 模型将向全球伙伴非免费开源大众汽车成为首发客户并基于能力提升将Robotaxi计划提前至2026年推三款车型[34] 公司战略与挑战 - 何小鹏个人执念驱动机器人低空等创新业务董事会最初不支持但公司定位升级为具身智能公司强调AI改变物理世界[36][37][43] - 新业务需解决与汽车主业的协同问题避免技术宣传过度而落地不足影响品牌势能形成完整商业化闭环[42][43] - 创新方向与特斯拉相似但需平衡投入与产出确保不辜负消费者期待通过实际产品能力证明竞争力[42]
从小鹏的“物理AI”,看中国智能化的下一步
观察者网· 2025-11-08 09:21
公司战略定位与愿景 - 公司定位从“一家面向全球的AI汽车公司”转向“物理AI世界的出行探索者,面向全球的具身智能公司”[7] - 公司展示涵盖第二代VLA模型、Robotaxi、人形机器人及飞行汽车的“物理AI”生态体系[9][14] - 公司采用“换维打法”,将汽车领域的AI模型技术移植到机器人等领域,实现跨域融合[14] 核心技术与产品进展 - 第二代VLA模型实现“视觉到动作”的端到端生成,车辆在复杂小路的平均接管里程提升13倍,并涌现出识别交警手势等未训练能力[11] - 新一代IRON人形机器人采用仿生脊椎与柔性皮肤,全身82个自由度,可实现“猫步”行走,被评价为“史上最像人类的人形机器人”[3][16][17] - Robotaxi计划于2026年推出三款车型,全车搭载4颗AI芯片,总算力达3000 TOPS,采用纯视觉方案[19] - 飞行汽车“陆地航母”将于2026年进入量产交付阶段,目前手握7000个订单,并计划在敦煌开启低空自驾旅游[21] 研发投入与商业化路径 - 公司研发投入长期维持在20%以上,采用阿里云3万卡算力集群,720亿参数大模型每五天全链路迭代一次[22] - 人形机器人将率先应用于工业场景,已与宝钢达成合作,计划明年投入巡检等应用[17] - 高德成为公司Robotaxi业务的全球首个生态合作伙伴[19] 行业趋势与宏观背景 - 中国汽车产业正沿着不同于硅谷和欧洲的第三条路前进,从“图纸定义产品”转向在数据流与模型系统中“培养能力”[10] - 国家政策推动核心系统自主可控,人工智能深入实体制造,目标到2027年新一代智能终端与智能体应用普及率超70%[16] - AI正驱动工厂演化为智能制造的数据中枢,车辆成为可持续学习的“物理智能节点”,行业竞争转向模型能力与算力体系的竞争[10][13]
小鹏Robotaxi和IRON发布:物理AI“安全大考”才刚刚开始
36氪· 2025-11-06 07:13
小鹏科技日核心观点 - 公司通过发布L4级Robotaxi量产计划、IRON人形机器人及物理世界大模型,探讨AI如何安全地融入现实物理世界,将技术焦点从参数展示拉回至日常生活场景[1] L4级Robotaxi技术架构 - 计划于2026年试运营L4级Robotaxi,其技术底气建立在三重架构上:六大核心系统(算力、转向、制动等)实现双冗余备份,可在50纳秒内完成故障切换,比人类眨眼快100万倍,为取消安全员提供物理基础[2] - 第二代VLA模型使AI摆脱对高精地图的依赖,能理解不同地域环境(如北京胡同与上海弄堂)并自适应各国交通规则,决策基于对物理世界的泛化理解[2] - 通过开放SDK引入高德等合作伙伴,旨在加速Robotaxi融入现有出行网络的商业化进程,但同时也扩展了安全责任的边界[2] IRON人形机器人特性 - IRON机器人高178厘米,其核心亮点并非行走能力,而是懂得如何安全地在生活空间中行动[4] - 配备“室内AEB”防撞系统以感知和规避家庭环境障碍,采用3颗图灵芯片分别处理视觉、决策与语言理解,能精准执行如“关掉客厅灯”等指令[7] - 采用全固态电池降低热失控风险,并承诺“隐私数据不出机器人”,为物理AI进入个人空间建立初步信任[7] 物理世界大模型技术 - 物理世界大模型是Robotaxi和IRON机器人的共同技术核心,与ChatGPT等互联网大模型本质区别在于其必须理解并服从物理定律[6] - 公司开发的720亿参数大模型使AI能从识别物体升级到判断其物理属性(如高度、承重)及运动轨迹,实现“通感一体”,同一模型可同时指导车辆礼让行人和机器人抓取力道[9] - 该模型具备对物理规律的编码能力,使AI能适应多样环境,如在漠河识别冰面反光,在海南判断积水深度[9] 行业安全路径探讨 - 公司路径强调“端侧强化”,通过极致的单车/单机智能与冗余保障安全,认为智能程度越高,安全冗余必须越充分,因物理世界的错误意味着真实伤害[10] - 行业存在另一路径即“系统级协同”,以蘑菇车联为例,其MogoMind大模型通过AI网络协同构建超越单车的安全体系,已在上海嘉定、云南大理等地落地项目[10] - 蘑菇车联的RoboBus实际运营里程已超200万公里,证明了AI网络协同在提升整体交通安全上的潜力[10] 物理AI发展前景与挑战 - 科技日描绘了2026年无人出租车和家庭机器人伙伴的近未来图景[11] - 在物理AI领域,安全被视为唯一的入场券而非一项功能,未来挑战包括AI如何理解人类模糊的社会意图及事故法律责任界定等[12]