Workflow
智能涌现
icon
搜索文档
物理AI20260622
2026-06-24 10:30
纪要涉及的行业或公司 * 行业:物理 AI(或称具身智能/机器人 AI)、机器人产业、人工智能、半导体(AI芯片/算力)、传感器、自动化零部件 * 提及的公司: * 海外:谷歌、英伟达、特斯拉、Anthropic * 国内:阿里、地平线、华为、舜宇光学、奥比中光、华睿(可能指大华股份旗下华睿科技)[序号1][序号23][序号57] * 其他:五一世界(数字孪生平台)、Isaac Sim(英伟达机器人仿真平台)[序号30][序号34] 核心观点和论据 1. 物理AI的定义与核心模型 * 物理AI是应用于真实物理空间、旨在帮助机器人完成复杂任务的大模型系统,其应用主体是机器人或自主设备,而非手机[序号4] * 核心模型包括: * **视觉语言模型**:融合视觉与语言,帮助机器人感知和理解环境,是当前技术重点(人类86%外部信息来自视觉)[序号5] * **视觉语言动作模型**:在VLM基础上增加动作,使机器人能进行自主行为决策[序号6] * **世界模型**:通过大量物理世界数据训练,使机器人能预测自身行为导致的物理世界变化(如物体移动、形变),是理解物理世界的“大脑”[序号7][序号8][序号9] * 三者关系:世界模型是理解物理世界的大脑,VLM负责场景理解与决策,VLA更多在执行层面[序号9] 2. 产业链投资机会(四大方向) * **模型厂商**:如谷歌、英伟达、阿里等[序号1] * **算力厂商**:包括云端训练和端侧推理芯片[序号1] * **感知硬件与零部件厂商**:包括传感器、执行器等[序号1] * **数据与仿真平台厂商**:为世界模型训练提供数据和仿真环境[序号1] 3. 算力需求:远超当前大语言模型,持续强劲 * **训练侧**:世界模型所需参数规模、算力及训练周期目前难以预测,但**一定远超大语言模型和2D图片/视频模型**,遵循Scaling Law规则[序号15][序号16][序号18] * **推理侧**: * 对**端侧算力需求巨大**,现有方案(如英伟达Jetson Orin/Thor)可能仍不足以为具备快速感知-决策-行动能力的通用机器人提供支持[序号21][序号22] * **低时延要求**:机器人需在**500毫秒内**做出反应,部分决策必须在端侧或边缘侧完成,无法全部依赖云端[序号24][序号38] * **国产芯片现状**:在机器人端侧推理芯片领域,国内厂商(如地平线、华为昇腾310)与海外(英伟达Jetson系列)仍有代差,从车规级转向机器人3D空间感知应用任重道远,目前鲜有大型机器人公司采用[序号23][序号25] 4. 感知硬件:3D视觉与力/触觉传感器是关键 * **核心硬件**: * **3D深度相机**:最为重要,是机器人获取立体空间信息(占外部信息86%)的主要设备,产业潜力大[序号26] * **力觉与触觉传感器**:包括关节力矩传感器、末端触觉传感器、电子皮肤等,是未来机器人必备,国内部分厂家发展较快[序号27] * **其他硬件**:激光雷达根据机器人形态和场景选配;麦克风阵列等声音传感器相对成熟[序号26][序号27] * **数据采集**:主要依赖视觉、力/触觉、关节运动及声音传感器,模拟人类“五感”[序号49][序号51] 5. 零部件:线性执行器与灵巧手是增量重点 * **价值量与增长空间**:随着机器人上量,所有零部件需求将同步增长[序号28] * **传统部件**:如减速器、电机等,国内供应链成熟,精度可满足当前要求(如精度达2丝)[序号29] * **新增需求与突破方向**: * **线性关节**:以丝杠为主的线性执行器,目前产业初期,增长空间可能更大[序号28] * **灵巧手**:在操作精细度、成本控制、耐用性等方面仍需进一步提升[序号29] 6. 数据与仿真平台:投入大、挑战大,是未来“金矿” * **国内现状**:在仿真引擎方面与海外有代差,缺乏有生态影响力的国产引擎,部分厂商基于国外开源技术[序号31] * **价值与商业模式**:拥有高质量数据或仿真平台,可为世界模型训练奠定基础。未来可能形成服务调用模式,并非所有机器人公司都能自研通用世界模型[序号32] * **投入巨大**: * 人工采集机器人操作数据成本高昂[序号33] * 更受青睐的路径是在数字孪生/仿真平台(如英伟达Isaac Sim)上生成和训练数据,但投入量级仍很大。例如,构建一个两三百平米的咖啡厅仿真场景,用自有算力卡也需跑约两天,外加人工标注[序号34][序号35] * 海外趋势是通过联盟(如谷歌的RT-X)或开源平台汇集多方数据共同训练[序号34] 7. 边缘计算:在物理AI场景下是必需,非伪命题 * **必要性**:机器人对**低时延(毫秒级)** 的刚性需求,决定了必须在端侧或边缘侧完成实时推理,无法容忍云端推理带来的延迟(如超过2秒的停顿)[序号24][序号38] * **应用模式**:可采用“边+端”结合的方式,在本地(如工厂内)部署边缘系统,作为云端推理的补充,加快响应速度[序号38][序号39] * **前景**:物理AI的落地将**显著拉动边缘推理需求**,相关厂商会受益[序号41] 8. 国内外发展对比与挑战 * **起步时间**:国内外在物理AI领域起步时间相近[序号44] * **国内挑战**: * **资本与技术密集**:物理AI是重资产、高投入行业,目前国内机器人公司体量可能不足以独立支撑世界模型的研发,需要进一步融资或与资本巨头合作[序号44][序号45] * **集中度**:国内参与方多,但技术集中度尚不明显[序号44] 其他重要内容 * **商业模式探讨**:物理AI模型厂商可能的收费模式包括按Token数量收费或按月订阅费,具体取决于模型提供商和使用者各自的投资回报率计算[序号13][序号14] * **传感器方案细节**:机器人视觉方案以**深度相机**为主(国内涉及舜宇光学、奥比中光等),激光雷达主要用于特定场景(如轮式设备避障),毫米波/超声波雷达使用较少[序号57]