Workflow
阿里千问大模型
icon
搜索文档
物理AI20260616
2026-06-17 21:58
行业与公司 * 涉及的行业为物理AI(具身智能)产业,涵盖机器人、自动驾驶、仿真软件、芯片、传感器等多个细分领域[1][2] * 涉及的公司类型多元,包括: * **海外巨头**:英伟达(算力芯片、Isaac Sim仿真平台、Cosmos基础模型)、谷歌DeepMind(Gemini模型)、特斯拉(Optimus机器人、垂直闭环)、Figure AI(Figure 01模型)、OpenAI、Waymo、苹果等[7][10][11] * **国内厂商**:地平线(端侧芯片)、奥比中光(3D深度相机)、光轮智能/光年智能(仿真数据与工具)、阿里(千问大模型)、索辰科技(CAE仿真软件)、Vesene、全核科技、埃斯顿、新松等[2][10][11][12][13][15] 核心观点与论据 1. 技术壁垒与核心差异 * **核心壁垒**主要体现在五个方面: 1. **数据**:最稀缺的是带有动作、结果和物理反馈的交互数据,需包含场景状态、目标、视觉流、动作轨迹及成败标签[8] 2. **Sim-to-Real能力**:高度依赖仿真数据,关键在于弥合仿真与现实的差距,确保物理仿真的准确性并用真实数据校准[8] 3. **泛化能力**:需应对新物体、不同光照、变化背景、新任务及动态干扰,要求远高于自动驾驶[8] 4. **长时序任务规划与执行能力**:考验模型在包含十几个步骤的复杂任务中的状态记忆、错误检测、自动恢复及鲁棒性[8] 5. **本体与模型的协同**:整体能力上限受制于硬件本体,跨硬件本体的迁移能力是关键[8] * **与传统多模态模型的差异**: * **数据层面**:物理AI模型不仅需要多模态感知数据,还需空间/物理理解数据(如声音、移动轨迹)和硬件本体的动作轨迹数据[3] * **能力层面**:需在训练中融入对物理世界的理解、预测与生成能力,通常通过引入世界模型(World Model)实现,而传统模型(如VAE)通常不具备[3] 2. 模型架构与技术路线 * **标准分层架构**(基于Transformer但更复杂)包含:多模态感知层、空间理解层、任务规划层(可引入世界预测能力)、动作生成层(使用diffusion policy等技术)、底层控制层、安全执行层,并需数据回灌机制持续迭代[5] * **技术路线分野**:存在多种实现方式,包括端到端架构、“高层推理+底层控制”双系统架构、增加扩散模型的架构、“世界模型+策略模型”架构等[6] * **机器人领域主流**:普遍采用“高层推理+底层控制”双系统架构[2][6] * **数据采集依赖**:高度依赖RGB-D深度信息,纯视觉方案(如特斯拉)门槛极高,国内方案多采用结构光或激光雷达[2][14] 3. 市场格局与参与者 * **格局多元化**:预计不会出现类似大语言模型领域的赢者通吃局面[2][7] * **参与者分类**: 1. **VLM路线公司**:如OpenAI、阿里千问[7] 2. **基础模型公司**:如General Robotics、英伟达(G100T)、Google[7] 3. **世界模型公司**:如英伟达(Cosmos)、字节跳动(World-V)、Waymo(Gaia)[7] 4. **专用计算模型公司**:如苹果(GRU-A导航模型)[7] 5. **垂直闭环模型公司**:如特斯拉(Optimus)、Figure(HX模型)[7] * **关键玩家定位**: * **英伟达**:已成为物理AI领域难以绕开的**底层基础设施平台**,提供算力芯片、仿真平台(Isaac Sim、Omniverse)及基础模型(Cosmos)[2][10] * **谷歌DeepMind**:偏向**模型公司**,打造覆盖多场景的基础模型生态系统[11] * **特斯拉**:**垂直整合型公司**,模型闭源并在自有体系内闭环应用,核心壁垒在于AI基建、软硬一体化和丰富场景[11] 4. 产业链价值分布与增长潜力 * **产业链环节**: * **上游**:算力与芯片(GPU、端侧芯片)、核心零部件(关节模组、传感器等,其中传感器提供关键力学数据)[9] * **中游**:数据与仿真(真实数据采集、虚拟数据生成)、模型与系统(各类模型公司、操作系统/中间件公司)[9] * **下游**:解决方案集成商[9] * **未来2-3年增长潜力排序**: 1. **算力与芯片**:已表现出强劲势头,国产化趋势下,国产端侧芯片公司(如地平线)将扮演关键角色[10] 2. **数据与仿真工具**:具备显著爆发潜力,机器人领域目前高度依赖英伟达生态,为国内仿真工具公司提供巨大机遇[10] 3. **核心零部件**:灵巧手和各类传感器供应商将受益于物理AI对硬件性能要求的提升[10] 4. **模型层面**:虽至关重要,但技术路线未完全收敛,市场竞争激烈,短期格局不明朗[10] 其他重要内容 1. 国产替代机遇 * **仿真软件**:若国产仿真软件能补齐高保真度、求解器算法及完善工具链能力,在大模型公司及具身智能需求推动下,将迎来较大市场需求,单客户年采购额可达**数百万元**[2][16] * **动捕设备深度相机**:在动捕数据采集的深度相机细分市场,**奥比中光占据主导地位,市场份额约70%**[15] 2. 数据采集具体要求 * **机器人真实数据**主要分四类:RGB-D数据(需深度相机)、3D数据(如点云,需激光雷达等)、本体状态数据(关节角度、扭矩等)、动作数据(通过遥操作记录轨迹)[14] * **数据存储**:通常以JSON格式存储,详细记录坐标、角度等信息[14] * **数据要求特点**:机器人对数据的要求并非单纯精度高,而是需要大量多模态数据为高频(底层控制频率500-1000赫兹)、低延迟(几毫秒以下)的动作执行提供安全保障[15] 3. 对相关产业的影响 * **CAE及仿真软件赛道**:物理AI的普及将整体利好该赛道,不仅垂直行业(机器人、汽车)需要,大模型公司训练也需要大量仿真数据,带动整体需求[17] * **国内CAE/工业AI公司机遇**:关键在于找准定位,从垂直场景(如机器人仿真、特定工业工艺仿真、数据合成)切入,打磨核心求解器和计算技术[12][13]