Workflow
宇树 G1 人形机器人
icon
搜索文档
王兴兴署名,宇树机器人春晚之后又进化了:单个策略就能学习各种极限动作
机器之心· 2026-03-03 16:14
核心观点 - 北京通用人工智能研究院、宇树科技等机构联合提出名为OmniXtreme的通用控制策略,首次实现了人形机器人执行各种极限动作的能力,包括连续翻转、极限平衡和霹雳舞等[3] - 该策略通过“基于流的生成控制策略预训练”与“驱动感知残差强化学习后训练”两阶段方法,成功打破了人形机器人高动态控制的“泛化壁垒”,实现了从仿真到现实的高保真迁移[4][10] - 在现实世界的宇树G1机器人上进行157次物理测试,涵盖24个高动态动作,整体平均成功率高达91.08%,其中后空翻成功率96.36%,武术动作成功率93.33%[28][29][30] 技术方法:OmniXtreme框架 - 框架设计旨在解决传统统一强化学习策略在动作库规模和多样性增加时遭遇的“性能崩溃”问题,该问题源于仿真中的学习瓶颈和真实世界的物理执行瓶颈[10] - **第一阶段:基于流的可扩展预训练** - 整合LAFAN1、AMASS、MimicKit等多个高质量动作数据集,并重定向至宇树G1机器人[13] - 利用PPO算法训练专家策略,再通过基于数据集聚合的知识蒸馏技术,将其统一融合到一个基于流匹配的生成式策略中[13] - 基于流的模型通过优化特定目标函数,学习从噪声中恢复专家动作,生成高精度的连续控制动作[17] - **第二阶段:驱动感知的后训练** - 冻结预训练的基础策略,在其之上训练一个轻量级MLP残差策略,以输出修正动作来对抗真实的硬件约束[18] - 引入了三个层面的深度建模以确保现实世界鲁棒性: 1. **激进的域随机化**:将初始姿态噪声、外力干扰等参数范围大幅提升最高50%,并将终止阈值放宽1.5倍,以提供充足的探索空间[19] 2. **功率安全驱动正则化**:创新性地引入针对机械功率的惩罚机制,计算关节扭矩与角速度的乘积(瞬时机械功率),并对超出安全死区的高额负功率应用严格的二次惩罚函数,重点施加于膝关节[20][22] 3. **驱动感知的扭矩与速度约束**:将真实的电机运行包络线集成到仿真器,并通过对非线性摩擦项建模,精确捕捉从静摩擦到动摩擦的平滑过渡及速度相关的耗散阻尼[23] 性能表现与实验结果 - **可扩展的高保真跟踪能力** - 在仿真环境中,OmniXtreme在所有评估指标上均碾压传统基线方法(“从头训练多动作强化学习”和“专家到统一MLP蒸馏”)[27] - 在包含约60个高挑战性动作的XtremeMotion评估集上,OmniXtreme维持了极低的运动学误差和极高的成功率,而传统方法的跟踪误差显著增加[26][27] - 具体数据:在LaFAN1+XtremeMotion数据集上,OmniXtreme(预训练+后训练)的MPJPE为30.93,成功率为98.54%;在纯XtremeMotion数据集上,成功率为95.64%[28] - **打破保真度与可扩展性的权衡** - 压力测试表明,随着训练动作集从10个扩展到50个,传统从头训练强化学习基线的成功率从100%暴跌至73.9%[31] - 相比之下,OmniXtreme在50个动作的训练集下,对核心动作的跟踪成功率依然坚挺在93.3%,证明了其在高多样性下的强大韧性[34] - **模型规模的Scaling Law** - 传统MLP策略在参数量扩大后很快陷入性能饱和,跟踪精度提升有限[35][37] - 基于流匹配的生成式策略完美契合Scaling Law,随着参数量向70M迈进,OmniXtreme的跟踪精度与鲁棒性呈现显著且稳定的线性增长[37] - **现实世界执行力的消融实验** - 对于翻腾动作,仅引入电机约束即可保障稳定执行[40] - 对于霹雳舞动作,需同时依赖电机约束与激进的域随机化,以在接触扰动中维持平衡[40] - 对于包含高速冲击缓冲的杂技落地动作,功率安全正则化机制至关重要,缺乏该机制会导致因电机瞬态制动而过流或电池欠压失败[40] 工程部署与硬件 - 整个推理管线使用TensorRT进行了深度优化,在宇树G1机器人的机载NVIDIA Jetson Orin NX平台上,实现了约10 ms的端到端推理延迟,完美支持50 Hz的高频闭环控制[24]
机器人产业跟踪:推进大脑进化,人形机器人量产爬坡有望加速,看好26H1量产机会
东方证券· 2025-12-21 13:13
行业投资评级 - 对机械设备行业给予“看好”评级,并维持该评级 [5] 核心观点 - 人形机器人产业在2025年运动控制技术取得快速进步,市场关注点正从技术展示转向实际量产情况 [8] - 量产面临三大挑战:灵巧的手、理解现实世界的AI大脑、大规模量产能力,其中AI大脑是产业量产最关键挑战 [8] - 为加速AI大脑进化,整机厂有望更快推进量产,看好2026年上半年(26H1)的量产投资机会 [8] - 站在量产未来看现在,具备优秀制造和管理能力的零部件企业将更加受益 [3] 产业动态与技术进步 - 2025年人形机器人运动控制技术进步快:特斯拉Optimus在5月掌握舞蹈、整理衣物等,9月制作爆米花,10月表演功夫 [8] - 宇树科技G1人形机器人于2025年12月18日在王力宏成都演唱会完成高难度动作伴舞 [8] - 特斯拉在2025年12月19日披露《特斯拉人形机器人2025年度报告》视频,展示了Optimus从基础运动控制到复杂场景交互的快速演变过程 [8] 量产预期与催化剂 - 根据特斯拉第三季度财报电话会议,马斯克预计特斯拉将在2026年2-3月准备好生产原型机 [8] - 模型训练速度与机器人数量正相关,为更快推动大脑进化,整机厂有望更快速推进量产 [8] - 报告看好2026年上半年(26H1)左右的机器人量产投资机会 [8] 投资建议与相关标的 - 投资建议关注具备优秀制造和管理能力的零部件企业 [3] - 相关标的包括:拓普集团(买入)、三花智控(买入)、五洲新春(买入)、恒立液压(未评级)、震裕科技(买入) [3]
装备制造行业周报(10月第2周):人形机器人商业化落地持续推进-20251013
世纪证券· 2025-10-13 09:28
报告行业投资评级 - 报告未明确给出整体行业投资评级 [1] 报告核心观点 - 人形机器人商业化落地持续推进,海外龙头厂商在应用场景的不断拓展将加快产业化落地进展 [1][3] - 光伏行业N型电池片景气度有所上行,国内“反内卷”政策加码背景下看好国内光伏电池需求 [3] - 工程机械出口保持双位数增长,在大基建项目拉动及存量设备更新周期向上背景下,内需复苏趋势明确,出口前景乐观 [3] 市场行情回顾 - 上周(2025年09月29日至2025年10月10日)4个交易日,机械设备、电力设备及汽车行业指数涨跌幅分别为+1.43%、+2.19%及+0.43%,在31个申万一级行业中排名分别为第15、11、22位;同期沪深300指数涨跌幅为+1.47% [1][8] - 机械设备、电力设备及汽车行业中表现靠前的细分方向为电网设备(上涨7.08%)、风电设备(上涨5.4%)、其他电源设备(上涨5.01%) [10] - 机械设备、电力设备及汽车行业中表现靠后的细分方向为摩托车及其他(下跌3.66%)、自动化设备(下跌0.36%)、电机(下跌0.31%) [10][12] 行业数据与细分领域观点 - 光伏:8月中国光伏电池组件出口金额为29.21亿美元,同比增长19.9%,环比增长31.34%;N型电池片价格普遍上涨,预计10月电池产量有所下降 [3] - 工程机械:2025年1-8月,中国工程机械出口额为386.4亿美元,同比增长11.4%,其中8月份出口同比增长15.5%;对一带一路、亚洲及非洲地区1-8月累计出口额同比增长分别为18%、15.9%及54.8% [3] - 人形机器人:10月9日,Figure发布第三代人形机器人产品,主打家庭应用场景,展示了浇花、端菜、叠衣服和整理房间等功能 [3] 行业要闻 - 特斯拉原计划2025年量产2000台Optimus人形机器人,但因手部与前臂设计存在技术瓶颈,量产被迫暂停 [16] - Figure AI发布新一代产品Figure 03,专为家庭设计,演示视频中所有动作均由机器人自主完成 [16] - 云深处发布新款行业级全天候人形机器人DR02,行走速度1.5米/秒,极限速度可达4米/秒 [16] - 宇树G1人形机器人基本款在美国沃尔玛网站售价为21600美元 [16] - 国际能源署预测2025至2030年期间全球可再生能源装机容量将增加4600吉瓦,太阳能光伏发电增长预计占全球可再生能源装机容量增长的约80% [18] - 全球已安装单机容量最大的漂浮式海上风电系统装备“三峡领航号”(16兆瓦)完成一体化组装 [18] 重点公司公告与动态 - 桂冠电力2025年前三季度累计完成发电量318.48亿千瓦时,同比增长14.89%,其中水电增长21.93%,光伏增长52.20% [17] - 冠盛股份表示其核心产品万向节可用于人形机器人肩关节、肘关节和膝关节等部位,已进行行业技术交流并投入研发;谐波减速器用交叉滚子轴承已试制样品并向相关厂商交样 [19] - 金杨股份可从事人形机器人精密结构件等生产,并战略投资了国华智能、参股投资了盈智科技、发起创立了智立传感,聚焦人形机器人核心部件 [19] - 赛力斯子公司与北京火山引擎科技有限公司签署合作框架协议,围绕“面向多模态云边协同的智能机器人决策、控制与人机增强技术”项目协同攻关 [19]