物理AI20260622 - Reportify

纪要涉及的行业或公司 * 行业：物理 AI（或称具身智能/机器人 AI）、机器人产业、人工智能、半导体（AI芯片/算力）、传感器、自动化零部件 * 提及的公司： * 海外：谷歌、英伟达、特斯拉、Anthropic * 国内：阿里、地平线、华为、舜宇光学、奥比中光、华睿（可能指大华股份旗下华睿科技）[序号1][序号23][序号57] * 其他：五一世界（数字孪生平台）、Isaac Sim（英伟达机器人仿真平台）[序号30][序号34] 核心观点和论据 1. 物理AI的定义与核心模型 * 物理AI是应用于真实物理空间、旨在帮助机器人完成复杂任务的大模型系统，其应用主体是机器人或自主设备，而非手机[序号4] * 核心模型包括： * 视觉语言模型：融合视觉与语言，帮助机器人感知和理解环境，是当前技术重点（人类86%外部信息来自视觉）[序号5] * 视觉语言动作模型：在VLM基础上增加动作，使机器人能进行自主行为决策[序号6] * 世界模型：通过大量物理世界数据训练，使机器人能预测自身行为导致的物理世界变化（如物体移动、形变），是理解物理世界的“大脑”[序号7][序号8][序号9] * 三者关系：世界模型是理解物理世界的大脑，VLM负责场景理解与决策，VLA更多在执行层面[序号9] 2. 产业链投资机会（四大方向） * 模型厂商：如谷歌、英伟达、阿里等[序号1] * 算力厂商：包括云端训练和端侧推理芯片[序号1] * 感知硬件与零部件厂商：包括传感器、执行器等[序号1] * 数据与仿真平台厂商：为世界模型训练提供数据和仿真环境[序号1] 3. 算力需求：远超当前大语言模型，持续强劲 * 训练侧：世界模型所需参数规模、算力及训练周期目前难以预测，但一定远超大语言模型和2D图片/视频模型，遵循Scaling Law规则[序号15][序号16][序号18] * 推理侧： * 对端侧算力需求巨大，现有方案（如英伟达Jetson Orin/Thor）可能仍不足以为具备快速感知-决策-行动能力的通用机器人提供支持[序号21][序号22] * 低时延要求：机器人需在500毫秒内做出反应，部分决策必须在端侧或边缘侧完成，无法全部依赖云端[序号24][序号38] * 国产芯片现状：在机器人端侧推理芯片领域，国内厂商（如地平线、华为昇腾310）与海外（英伟达Jetson系列）仍有代差，从车规级转向机器人3D空间感知应用任重道远，目前鲜有大型机器人公司采用[序号23][序号25] 4. 感知硬件：3D视觉与力/触觉传感器是关键 * 核心硬件： * 3D深度相机：最为重要，是机器人获取立体空间信息（占外部信息86%）的主要设备，产业潜力大[序号26] * 力觉与触觉传感器：包括关节力矩传感器、末端触觉传感器、电子皮肤等，是未来机器人必备，国内部分厂家发展较快[序号27] * 其他硬件：激光雷达根据机器人形态和场景选配；麦克风阵列等声音传感器相对成熟[序号26][序号27] * 数据采集：主要依赖视觉、力/触觉、关节运动及声音传感器，模拟人类“五感”[序号49][序号51] 5. 零部件：线性执行器与灵巧手是增量重点 * 价值量与增长空间：随着机器人上量，所有零部件需求将同步增长[序号28] * 传统部件：如减速器、电机等，国内供应链成熟，精度可满足当前要求（如精度达2丝）[序号29] * 新增需求与突破方向： * 线性关节：以丝杠为主的线性执行器，目前产业初期，增长空间可能更大[序号28] * 灵巧手：在操作精细度、成本控制、耐用性等方面仍需进一步提升[序号29] 6. 数据与仿真平台：投入大、挑战大，是未来“金矿” * 国内现状：在仿真引擎方面与海外有代差，缺乏有生态影响力的国产引擎，部分厂商基于国外开源技术[序号31] * 价值与商业模式：拥有高质量数据或仿真平台，可为世界模型训练奠定基础。未来可能形成服务调用模式，并非所有机器人公司都能自研通用世界模型[序号32] * 投入巨大： * 人工采集机器人操作数据成本高昂[序号33] * 更受青睐的路径是在数字孪生/仿真平台（如英伟达Isaac Sim）上生成和训练数据，但投入量级仍很大。例如，构建一个两三百平米的咖啡厅仿真场景，用自有算力卡也需跑约两天，外加人工标注[序号34][序号35] * 海外趋势是通过联盟（如谷歌的RT-X）或开源平台汇集多方数据共同训练[序号34] 7. 边缘计算：在物理AI场景下是必需，非伪命题 * 必要性：机器人对低时延（毫秒级） 的刚性需求，决定了必须在端侧或边缘侧完成实时推理，无法容忍云端推理带来的延迟（如超过2秒的停顿）[序号24][序号38] * 应用模式：可采用“边+端”结合的方式，在本地（如工厂内）部署边缘系统，作为云端推理的补充，加快响应速度[序号38][序号39] * 前景：物理AI的落地将显著拉动边缘推理需求，相关厂商会受益[序号41] 8. 国内外发展对比与挑战 * 起步时间：国内外在物理AI领域起步时间相近[序号44] * 国内挑战： * 资本与技术密集：物理AI是重资产、高投入行业，目前国内机器人公司体量可能不足以独立支撑世界模型的研发，需要进一步融资或与资本巨头合作[序号44][序号45] * 集中度：国内参与方多，但技术集中度尚不明显[序号44] 其他重要内容 * 商业模式探讨：物理AI模型厂商可能的收费模式包括按Token数量收费或按月订阅费，具体取决于模型提供商和使用者各自的投资回报率计算[序号13][序号14] * 传感器方案细节：机器人视觉方案以深度相机为主（国内涉及舜宇光学、奥比中光等），激光雷达主要用于特定场景（如轮式设备避障），毫米波/超声波雷达使用较少[序号57]