纪要涉及的行业或公司 * 行业:物理 AI(或称具身智能/机器人 AI)、机器人产业、人工智能、半导体(AI芯片/算力)、传感器、自动化零部件 * 提及的公司: * 海外:谷歌、英伟达、特斯拉、Anthropic * 国内:阿里、地平线、华为、舜宇光学、奥比中光、华睿(可能指大华股份旗下华睿科技)[序号1][序号23][序号57] * 其他:五一世界(数字孪生平台)、Isaac Sim(英伟达机器人仿真平台)[序号30][序号34] 核心观点和论据 1. 物理AI的定义与核心模型 * 物理AI是应用于真实物理空间、旨在帮助机器人完成复杂任务的大模型系统,其应用主体是机器人或自主设备,而非手机[序号4] * 核心模型包括: * 视觉语言模型:融合视觉与语言,帮助机器人感知和理解环境,是当前技术重点(人类86%外部信息来自视觉)[序号5] * 视觉语言动作模型:在VLM基础上增加动作,使机器人能进行自主行为决策[序号6] * 世界模型:通过大量物理世界数据训练,使机器人能预测自身行为导致的物理世界变化(如物体移动、形变),是理解物理世界的“大脑”[序号7][序号8][序号9] * 三者关系:世界模型是理解物理世界的大脑,VLM负责场景理解与决策,VLA更多在执行层面[序号9] 2. 产业链投资机会(四大方向) * 模型厂商:如谷歌、英伟达、阿里等[序号1] * 算力厂商:包括云端训练和端侧推理芯片[序号1] * 感知硬件与零部件厂商:包括传感器、执行器等[序号1] * 数据与仿真平台厂商:为世界模型训练提供数据和仿真环境[序号1] 3. 算力需求:远超当前大语言模型,持续强劲 * 训练侧:世界模型所需参数规模、算力及训练周期目前难以预测,但一定远超大语言模型和2D图片/视频模型,遵循Scaling Law规则[序号15][序号16][序号18] * 推理侧: * 对端侧算力需求巨大,现有方案(如英伟达Jetson Orin/Thor)可能仍不足以为具备快速感知-决策-行动能力的通用机器人提供支持[序号21][序号22] * 低时延要求:机器人需在500毫秒内做出反应,部分决策必须在端侧或边缘侧完成,无法全部依赖云端[序号24][序号38] * 国产芯片现状:在机器人端侧推理芯片领域,国内厂商(如地平线、华为昇腾310)与海外(英伟达Jetson系列)仍有代差,从车规级转向机器人3D空间感知应用任重道远,目前鲜有大型机器人公司采用[序号23][序号25] 4. 感知硬件:3D视觉与力/触觉传感器是关键 * 核心硬件: * 3D深度相机:最为重要,是机器人获取立体空间信息(占外部信息86%)的主要设备,产业潜力大[序号26] * 力觉与触觉传感器:包括关节力矩传感器、末端触觉传感器、电子皮肤等,是未来机器人必备,国内部分厂家发展较快[序号27] * 其他硬件:激光雷达根据机器人形态和场景选配;麦克风阵列等声音传感器相对成熟[序号26][序号27] * 数据采集:主要依赖视觉、力/触觉、关节运动及声音传感器,模拟人类“五感”[序号49][序号51] 5. 零部件:线性执行器与灵巧手是增量重点 * 价值量与增长空间:随着机器人上量,所有零部件需求将同步增长[序号28] * 传统部件:如减速器、电机等,国内供应链成熟,精度可满足当前要求(如精度达2丝)[序号29] * 新增需求与突破方向: * 线性关节:以丝杠为主的线性执行器,目前产业初期,增长空间可能更大[序号28] * 灵巧手:在操作精细度、成本控制、耐用性等方面仍需进一步提升[序号29] 6. 数据与仿真平台:投入大、挑战大,是未来“金矿” * 国内现状:在仿真引擎方面与海外有代差,缺乏有生态影响力的国产引擎,部分厂商基于国外开源技术[序号31] * 价值与商业模式:拥有高质量数据或仿真平台,可为世界模型训练奠定基础。未来可能形成服务调用模式,并非所有机器人公司都能自研通用世界模型[序号32] * 投入巨大: * 人工采集机器人操作数据成本高昂[序号33] * 更受青睐的路径是在数字孪生/仿真平台(如英伟达Isaac Sim)上生成和训练数据,但投入量级仍很大。例如,构建一个两三百平米的咖啡厅仿真场景,用自有算力卡也需跑约两天,外加人工标注[序号34][序号35] * 海外趋势是通过联盟(如谷歌的RT-X)或开源平台汇集多方数据共同训练[序号34] 7. 边缘计算:在物理AI场景下是必需,非伪命题 * 必要性:机器人对低时延(毫秒级) 的刚性需求,决定了必须在端侧或边缘侧完成实时推理,无法容忍云端推理带来的延迟(如超过2秒的停顿)[序号24][序号38] * 应用模式:可采用“边+端”结合的方式,在本地(如工厂内)部署边缘系统,作为云端推理的补充,加快响应速度[序号38][序号39] * 前景:物理AI的落地将显著拉动边缘推理需求,相关厂商会受益[序号41] 8. 国内外发展对比与挑战 * 起步时间:国内外在物理AI领域起步时间相近[序号44] * 国内挑战: * 资本与技术密集:物理AI是重资产、高投入行业,目前国内机器人公司体量可能不足以独立支撑世界模型的研发,需要进一步融资或与资本巨头合作[序号44][序号45] * 集中度:国内参与方多,但技术集中度尚不明显[序号44] 其他重要内容 * 商业模式探讨:物理AI模型厂商可能的收费模式包括按Token数量收费或按月订阅费,具体取决于模型提供商和使用者各自的投资回报率计算[序号13][序号14] * 传感器方案细节:机器人视觉方案以深度相机为主(国内涉及舜宇光学、奥比中光等),激光雷达主要用于特定场景(如轮式设备避障),毫米波/超声波雷达使用较少[序号57]
物理AI20260622
2026-06-24 10:30