WholeBodyVLA
搜索文档
人形机器人行业深度报告:智元:具身智能全栈龙头,量产进度与模型能力领先
浙商证券· 2026-03-28 18:24
行业投资评级 * **看好**:报告对行业给予“看好”评级,预期行业指数相对于沪深300指数表现+10%以上[120] 核心观点 * **行业处于爆发前夕**:人形机器人行业正经历从初始期到成长期的拐点,量产临近、应用落地,即将迎来爆发[3][5][9] * **市场空间广阔**:全球人形机器人市场规模预计将从2025年的206亿元人民币增长到2035年的约16800亿元人民币,2025-2035年复合年增长率为49.2%[5][12] * **智元机器人是行业龙头**:智元机器人作为具身智能全栈自研的龙头企业,在整机、核心零部件、大小脑方面自研能力构筑高壁垒,产品矩阵覆盖全面,量产进度与模型能力领先[3][4][5] * **投资聚焦整机龙头与核心供应链**:投资建议聚焦以智元机器人为代表的整机龙头,及其核心零部件、战略合作卡位领先的厂商[5] 根据目录总结 01 人形机器人行业:量产将近,应用元年,即将爆发 * **行业处于爆发拐点**:人形机器人硬件已逐步收敛,模型仍有提升空间,但整体已具备落地条件,目前正处于从初始期到成长期的爆发前夕[9][10] * **市场潜力巨大**:在劳动力短缺、人工成本昂贵的背景下,全球人形机器人市场规模预计将从2025年的206亿元人民币(29.8亿美元)增长到2035年的约16800亿元人民币(2434亿美元),复合年增长率为49.2%,市场空间达万亿级别[5][12] 02 智元机器人:具身智能全栈自研筑造高壁垒,三大家族产品矩阵覆盖全面 * **全栈自研与多形态产品**:智元机器人成立于2023年,是业内稀缺的全产品系列、全场景布局的机器人企业,拥有远征、精灵、灵犀三大产品家族,覆盖全尺寸、半尺寸、轮式等多种形态[5][15][16] * **出货量与市场地位领先**:得益于全栈自研能力和全面的应用场景覆盖,2025年公司人形机器人出货量达5168台,据Omdia数据,2025年全球出货量约1.3万台,智元市占率约35%,出货量和市场份额全球领先[5][42][43] * **产品性能获国际认可**:在Omdia的八大核心维度评价中,智元产品在六项获评最高评级,尤其在灵巧操作、AI学习与定制化能力上具备显著优势[5][37] * **管理层实力雄厚**:公司实控人兼董事长邓泰华曾任华为副总裁,联合创始人彭志辉(稚晖君)是华为“天才少年”和B站顶流科技UP主,兼具产业资源与IP效应[5][49][51] * **控股上纬新材拓展赛道**:2025年10月,公司通过收购上纬新材63.6%的股份成为其控股股东,上纬新材以“上纬启元”品牌进军个人机器人赛道,发布了全球首款全身力控小尺寸人形机器人启元Q1[5][54][55] 03 零部件、模型能力领先,数据、应用场景生态闭环 * **具身大模型能力突出**:公司推出了GO-1、WholeBodyVLA和GenieReasoner三款具身大模型,其中GO-1在泛化能力和学习效率方面表现突出,仅用20%的数据量即可达成2.7倍的效果[5][36][64][67] * **拥有全球领先真实数据集**:公司自建了国内首个专业数采工厂,每日可收集3-5万条数据,并于2024年末开源全球首个百万真机数据集AgiBot World,收录五大场景超100种细分应用场景数据,数据质量达工业级标准[5][69] * **构建紧密的产业生态**:公司通过战略合作、成立合资公司等方式,与产业链众多优质企业紧密合作,已孵化十余家具身智能产业链企业,生态覆盖核心供应链、智能大脑、机器人本体及解决方案等多环节[5][72][75][77] 04 重点标的 * **推荐标的**:报告推荐了拓普集团、恒立液压、汇川技术、浙江荣泰、五洲新春、金沃股份、中大力德、奥比中光、兆威机电、汉威科技、福莱新材、晶华新材、华翔股份、上海沿浦、均胜电子、柯力传感、江苏雷利等核心零部件及战略合作厂商[5][82] * **关注标的**:报告建议关注三花智控、上纬新材、绿的谐波、蓝思科技、宁波华翔、长盈精密、领益智造、博众精工、峰岹科技、恒工精密、富临精工、卧龙电驱、均普智能、华依科技、天准科技、软通动力、格力博、龙旗科技、科大讯飞、超捷股份、徕木股份、商络电子、豪森智能、德马科技、大丰实业、东阳光、玉禾田等其他相关公司[5][82]
复旦&港大等团队!WholeBodyVLA:面向全身移动操作控制的VLA框架
具身智能之心· 2025-12-18 08:07
文章核心观点 - 由复旦、港大等团队提出的WholeBodyVLA框架,是首个实现大范围人形机器人端到端移动-操作的系统之一,通过统一潜在动作学习和面向移动-操作的强化学习策略,解决了现有方法在“操作感知型移动”方面的不足,在AgiBot X2机器人上的实验表明,其性能比现有基线方法提升21.3% [4][5][12] 现有方法的不足与核心挑战 - 现有模块化或端到端方法无法规划和执行能主动创造操作前提条件(如接近、调整姿态)的移动,而是将移动和操作视为独立阶段,限制了机器人的工作空间 [2][3] - 核心挑战在于“操作感知型移动”,以及两个根本问题:人形机器人遥操作数据稀缺,以及现有强化学习控制器的精度和稳定性有限 [4][6] WholeBodyVLA提出的解决方案 - **统一潜在动作学习**:设计了一个学习框架,使视觉语言动作系统能够从低成本、无动作标签的第一视角人类视频中学习移动-操作知识,以缓解数据稀缺问题 [4][6][8] - **面向移动-操作的强化学习策略**:提出采用简化离散指令接口的LMO策略,专门优化前进、转弯、下蹲等核心移动-操作动作的准确性和稳定性,以解决低层执行不可靠的问题 [4][10] - **高效数据采集**:设计了仅需单操作员和单目相机的低成本、高效人类第一视角数据采集流程,以扩充数据集 [4][19] WholeBodyVLA方法细节 - **分离的潜在动作模型**:由于移动和操作视频的视觉变化模式不同,分别训练了用于操作的LAM和用于移动的LAM,再联合监督VLA训练,以避免性能不佳 [17][18] - **VLA训练与执行**:VLA基于视觉和语言指令,通过交叉熵损失联合预测两种潜在动作,轻量级解码器将其映射为机器人特定的上肢关节角度和移动指令,再由LMO策略转换为下肢力矩执行 [19] - **LMO策略设计**:采用仅依赖本体感受状态的紧凑观测空间,以及明确启停语义的离散指令接口,并通过两阶段课程学习和参考塑形来优化精度与稳定性 [20][21][22][24] 实验验证与性能 - **任务设置**:在AgiBot X2机器人上评估了三个综合任务:装袋、装箱和推车,以评估双臂协同、下蹲精度、转弯准确性和重载稳定性 [26][27] - **性能对比**:在三个任务的平均得分上,WholeBodyVLA达到78.0%,显著高于模块化设计的64.0%、GR00T w/ LMO的42.0%和OpenVLA-OFT w/ LMO的56.7% [31] - **消融实验**:移除统一潜在学习会导致成功率下降38.7%;使用基于速度的RL控制器变体成功率低24%;分离LAM设计优于共享单一LAM [31][32][36] 技术贡献验证 - **无标签视频的贡献**:使用人类第一视角视频进行潜在预训练能显著提升性能并减少对遥操作数据的依赖,使用超过50%人类视频预训练的模型,仅用25条遥操作轨迹微调即可匹配使用较少视频但需200条轨迹微调的模型性能 [35] - **LMO的贡献**:LMO策略有效解决了基于速度控制器常见的绊倒、路径偏移等问题,在扩展任务(如不平坦地形、长多步序列)中表现出更高的可靠性 [36] - **泛化能力**:框架在更具挑战性的场景中(如不平坦地形遍历、长时程多步序列、日常移动-操作活动)均保持性能优势,展现出强大的泛化能力和可扩展性 [38]
人形机器人自主控制新突破:VLA驱动全身协同,行走与操作同时完成
凤凰网· 2025-12-17 15:57
核心观点 - 联合研究团队提出了一种名为WholeBodyVLA的新框架,旨在实现人形机器人对装箱、搬运、推车等需要移动与操作协同的全身控制任务,这为将视觉-语言-动作(VLA)范式扩展至双足人形机器人全身控制提供了可行路径 [1][2] 技术突破与框架特点 - 该框架基于智元灵犀X2研究发布,将视觉-语言-动作(VLA)扩展至双足人形机器人的全身控制,并验证了其在全身移动操作任务中的可行性 [1] - WholeBodyVLA通过从人类第一视角视频中学习移动与操作的潜在动作表示,以降低对昂贵机器人遥操作数据的依赖 [1] - 研究团队设计了一种面向移动操作的强化学习控制器,通过简化控制目标来提升运动执行的稳定性 [1] 实验验证与性能表现 - 实验验证显示,该框架使机器人能在不同起始位置走向目标并完成操作,并对场景和物体表现出一部分泛化能力 [2] - 该框架在干扰地形上也能保持机器人的基本移动方向与平衡 [2]