物理AI20260616
2026-06-17 21:58

行业与公司 * 涉及的行业为物理AI(具身智能)产业,涵盖机器人、自动驾驶、仿真软件、芯片、传感器等多个细分领域[1][2] * 涉及的公司类型多元,包括: * 海外巨头:英伟达(算力芯片、Isaac Sim仿真平台、Cosmos基础模型)、谷歌DeepMind(Gemini模型)、特斯拉(Optimus机器人、垂直闭环)、Figure AI(Figure 01模型)、OpenAI、Waymo、苹果等[7][10][11] * 国内厂商:地平线(端侧芯片)、奥比中光(3D深度相机)、光轮智能/光年智能(仿真数据与工具)、阿里(千问大模型)、索辰科技(CAE仿真软件)、Vesene、全核科技、埃斯顿、新松等[2][10][11][12][13][15] 核心观点与论据 1. 技术壁垒与核心差异 * 核心壁垒主要体现在五个方面: 1. 数据:最稀缺的是带有动作、结果和物理反馈的交互数据,需包含场景状态、目标、视觉流、动作轨迹及成败标签[8] 2. Sim-to-Real能力:高度依赖仿真数据,关键在于弥合仿真与现实的差距,确保物理仿真的准确性并用真实数据校准[8] 3. 泛化能力:需应对新物体、不同光照、变化背景、新任务及动态干扰,要求远高于自动驾驶[8] 4. 长时序任务规划与执行能力:考验模型在包含十几个步骤的复杂任务中的状态记忆、错误检测、自动恢复及鲁棒性[8] 5. 本体与模型的协同:整体能力上限受制于硬件本体,跨硬件本体的迁移能力是关键[8] * 与传统多模态模型的差异: * 数据层面:物理AI模型不仅需要多模态感知数据,还需空间/物理理解数据(如声音、移动轨迹)和硬件本体的动作轨迹数据[3] * 能力层面:需在训练中融入对物理世界的理解、预测与生成能力,通常通过引入世界模型(World Model)实现,而传统模型(如VAE)通常不具备[3] 2. 模型架构与技术路线 * 标准分层架构(基于Transformer但更复杂)包含:多模态感知层、空间理解层、任务规划层(可引入世界预测能力)、动作生成层(使用diffusion policy等技术)、底层控制层、安全执行层,并需数据回灌机制持续迭代[5] * 技术路线分野:存在多种实现方式,包括端到端架构、“高层推理+底层控制”双系统架构、增加扩散模型的架构、“世界模型+策略模型”架构等[6] * 机器人领域主流:普遍采用“高层推理+底层控制”双系统架构[2][6] * 数据采集依赖:高度依赖RGB-D深度信息,纯视觉方案(如特斯拉)门槛极高,国内方案多采用结构光或激光雷达[2][14] 3. 市场格局与参与者 * 格局多元化:预计不会出现类似大语言模型领域的赢者通吃局面[2][7] * 参与者分类: 1. VLM路线公司:如OpenAI、阿里千问[7] 2. 基础模型公司:如General Robotics、英伟达(G100T)、Google[7] 3. 世界模型公司:如英伟达(Cosmos)、字节跳动(World-V)、Waymo(Gaia)[7] 4. 专用计算模型公司:如苹果(GRU-A导航模型)[7] 5. 垂直闭环模型公司:如特斯拉(Optimus)、Figure(HX模型)[7] * 关键玩家定位: * 英伟达:已成为物理AI领域难以绕开的底层基础设施平台,提供算力芯片、仿真平台(Isaac Sim、Omniverse)及基础模型(Cosmos)[2][10] * 谷歌DeepMind:偏向模型公司,打造覆盖多场景的基础模型生态系统[11] * 特斯拉垂直整合型公司,模型闭源并在自有体系内闭环应用,核心壁垒在于AI基建、软硬一体化和丰富场景[11] 4. 产业链价值分布与增长潜力 * 产业链环节: * 上游:算力与芯片(GPU、端侧芯片)、核心零部件(关节模组、传感器等,其中传感器提供关键力学数据)[9] * 中游:数据与仿真(真实数据采集、虚拟数据生成)、模型与系统(各类模型公司、操作系统/中间件公司)[9] * 下游:解决方案集成商[9] * 未来2-3年增长潜力排序: 1. 算力与芯片:已表现出强劲势头,国产化趋势下,国产端侧芯片公司(如地平线)将扮演关键角色[10] 2. 数据与仿真工具:具备显著爆发潜力,机器人领域目前高度依赖英伟达生态,为国内仿真工具公司提供巨大机遇[10] 3. 核心零部件:灵巧手和各类传感器供应商将受益于物理AI对硬件性能要求的提升[10] 4. 模型层面:虽至关重要,但技术路线未完全收敛,市场竞争激烈,短期格局不明朗[10] 其他重要内容 1. 国产替代机遇 * 仿真软件:若国产仿真软件能补齐高保真度、求解器算法及完善工具链能力,在大模型公司及具身智能需求推动下,将迎来较大市场需求,单客户年采购额可达数百万元[2][16] * 动捕设备深度相机:在动捕数据采集的深度相机细分市场,奥比中光占据主导地位,市场份额约70%[15] 2. 数据采集具体要求 * 机器人真实数据主要分四类:RGB-D数据(需深度相机)、3D数据(如点云,需激光雷达等)、本体状态数据(关节角度、扭矩等)、动作数据(通过遥操作记录轨迹)[14] * 数据存储:通常以JSON格式存储,详细记录坐标、角度等信息[14] * 数据要求特点:机器人对数据的要求并非单纯精度高,而是需要大量多模态数据为高频(底层控制频率500-1000赫兹)、低延迟(几毫秒以下)的动作执行提供安全保障[15] 3. 对相关产业的影响 * CAE及仿真软件赛道:物理AI的普及将整体利好该赛道,不仅垂直行业(机器人、汽车)需要,大模型公司训练也需要大量仿真数据,带动整体需求[17] * 国内CAE/工业AI公司机遇:关键在于找准定位,从垂直场景(如机器人仿真、特定工业工艺仿真、数据合成)切入,打磨核心求解器和计算技术[12][13]

物理AI20260616 - Reportify