VLA模型 - 财报，业绩电话会，研报，新闻

VLA模型

搜索文档

2025商用具身智能白皮书

艾瑞咨询· 2026-02-09 08:03

核心观点 - 具身智能是人工智能的重要发展方向和实现通用人工智能的关键路径，正从实验室走向产业化，万亿级市场脉络已打开 [1][2] - 中美两国在具身智能领域展开关键战略竞争，中国凭借政策支持、场景驱动和产业链协同加速追赶，美国则拥有算力、顶尖模型和资本生态的先发优势 [1][6][11] - 行业当前处于大规模商业化的前夜，面临数据、技术、成本和商业模式等多重瓶颈，但正通过技术演进、数据突破和商业模式创新逐步解决，预计未来5-10年将进入爆发期 [13][37][46] 行业定义与战略意义 - **定义**：具身智能是智能体依托物理身体，通过感知-理解-决策-行动的闭环与环境强交互并持续学习，展现出自主性、泛化性和适应性，是AI走向落地化和实用化的重要标志 [2] - **战略意义**：是推动科技产业链升级和培育新兴产业的重要力量，将带动芯片、传感器、AI大模型、能源等产业链协同创新，并促进制造、交通、零售、医疗等场景转型升级 [6] - **中美竞争**：具身智能是中美科技竞争的关键战役，关乎长期经济效益、科技自立自强与国家竞争力提升，是中国实现“弯道超车”的关键赛点 [6] 商用场景分类 - **商用具身智能**：服务于零售、餐饮、医疗、安防等复杂动态环境，更依赖多模态感知、人机交互和泛化能力，旨在提升服务体验与灵活运营 [4] - **工业具身智能**：面向制造、能源、矿山等高度结构化场景，强调高精度、高负载和长周期稳定性，目标是提升效率与保障安全 [4] 政策与市场环境 - **中国政策激励**：近两年来，中国将具身智能纳入国家战略，中央层面密集出台行动方案、发展指导意见与资金支持，地方政府也发布专项规划、设立基金并建立产业联盟，推动行业加速发展 [8][9] - **资本市场火热**：全球资本市场高度关注，中美企业融资额与频率齐升，A轮融资额1-3亿美元已是常态，例如Figure在2025年9月C轮融资超10亿美元，估值达390亿美元 [43][44] - **全球市场规模预测**：根据顶尖机构预测，2025年全球具身智能规模达192亿元人民币，未来五年复合增长率达73%，预计十年左右达到年万亿级市场需求，机器人单价有望从百万级降至20多万人民币 [46] - **中国市场规模预测**：凭借完善的工业体系和供应链，中国预计五年左右进入快速降本通道，市场规模将从2025年的21亿元增长至2035年的超过2800亿元，实现十年百余倍增长 [49][50] 技术发展现状与瓶颈 - **发展阶段**：全球发展经历了从哲学思辨（1950年起）、技术积累（2000-2020年）到大模型驱动与应用拓展（2020年以来）三个阶段，目前进入快速演进新拐点 [11] - **核心瓶颈**： - **数据挑战**：高质量实操数据稀缺，仿真数据存在缺陷，且缺乏数据评价机制，数据获取主要依赖遥操作、仿真合成、动作捕捉及互联网视频图像 [13][15][16] - **技术瓶颈**：灵巧手、泛化能力与Sim2Real（从仿真到现实）迁移等技术尚未成熟 [13] - **成本瓶颈**：核心部件与算力投入居高不下 [13] - **商业瓶颈**：投资回报周期长，伦理安全问题待解 [13] - **数据突破**：业界正通过“世界模型”、建设数据采集训练场（如2025年起在北京、上海等地建设）、以及工具创新等方式探索解决方案，数据获取的多元路径正在形成 [19] 模型与技术演进 - **模型演进共识**：视觉-语言-动作模型正成为发展共识，其通过多模态统一框架，将大语言模型的推理能力与真实世界的感知、行动能力深度融合，催生“机器人大脑” [21] - **演进路径**：从2022年Google SayCan的初步验证，到2023年PaLM-E的能力跃迁，再到2024-2025年OpenVLA等开源模型推动生态开放，技术核心能力向多模态统一感知和跨场景任务泛化发展 [21][22] - **架构趋势**：单一模型无法满足复杂现实场景，混合分层架构（“大脑”与“小脑”协同）成为必然趋势，即高层大模型负责认知规划，底层成熟算法保证可靠执行 [23] - **自主化程度**：类比自动驾驶，目前处于L2（辅助自主）向L3（有条件自主）的过渡阶段；类比大语言模型，则已达到GPT-2水平，未来2-3年或达到能力质变临界点 [27] 核心部件与产业链 - **灵巧手**：是实现人机交互与精细操作的核心部件，面临结构紧凑性、敏捷性与可靠性的“三难困境”，是技术、工艺难度最大的环节之一 [25] - **产业链图谱**：产业链复杂度高，涵盖执行器、传感、计算、机身、电池、基础模型等漫长链条，可通过硬件、大脑和集成商三个维度划分，中国企业在产业环节覆盖度和下游整机集成上已占优势 [41] - **关键部件案例**：因时机器人作为微型伺服电缸领导者，通过垂直整合自研核心部件，赋能工业制造、人形机器人和科研等核心场景 [83][85][88] 商业化进展与趋势 - **商业化突破点**：大规模商业化需在续航、延迟、执行、可靠性与经济效益五大维度均跨过可用门槛，形成正向价值飞轮 [29] - **渗透顺序**：商业化沿价值阶梯演进，初期集中在高投资回报率、低复杂度的确定性场景（如工业制造、仓储自动化、餐饮零售基础场景），未来向高复杂度、高价值的战略性场景渗透 [31][34] - **付费模式演进**：从当前的一次性整机销售为主，可能逐步演进为“机器人即服务”模式，最终发展至“按任务完成效果付费” [35] - **中国出海加速**：2024-2025年进入出海加速期，商业服务与工业机器人出口显著增长，形成全球第二大出口市场，代表企业正从“单点出货”迈向“体系化落地” [53][54] 竞争格局与玩家分析 - **三类核心玩家**： - **通用技术挑战者**：如Figure，凭借顶尖AI技术、创业精神和资本加持，旨在抢占技术制高点 [55] - **场景资源先行者**：如ABB、擎朗智能，依托深厚的硬件工程能力与扎实的客户根基，从专用场景向泛化智能应用升级 [55][66] - **跨界需求巨头**：如特斯拉、亚马逊，从自身海量真实需求出发，推动产业商业化加速 [55] - **整合趋势**：产品同质化已现，高昂的研发投入、复杂的供应链管理等挑战将导致行业在未来三年内不可避免的整合与洗牌，最终形成少数玩家的市场格局 [57] - **初创企业策略**：面对巨头竞争，需比巨头看得更准、行动更快、人效更高，并找到能带来长期赋能的战略伙伴和投资人 [59][60] 代表企业案例 - **Figure AI**：美国代表性企业，估值390亿美元，致力于打造通用自主人形机器人，其产品快速迭代并引入自研Helix通用VLA模型，旨在实现跨场景泛化能力 [64][65] - **擎朗智能**：中国代表企业，实现人形与轮式机器人双线布局，构建完整的产品生态矩阵，在全球服务实践中积累了丰富的场景数据和技术壁垒，并在智慧酒店等场景实现商业化落地 [66][71][73] - **节卡机器人**：拥有多元产品生态，在汽车、电子等工业场景大规模部署，依托存量设备网络构建了独特的数据优势和分层混合架构，推动技术快速落地 [77][79][81] - **特斯拉Optimus**：从概念到快速迭代，Gen 2展示了更轻、更快、更灵巧的动作能力，马斯克预测最早2025年底对外销售，2026年批量生产，长期目标百万级年产量 [62]