Workflow
小鹏机器人XPeng IRON
icon
搜索文档
CVPR 2026|机器人真的「像人」了吗?我们做了一场只看动作的图灵测试
机器之心· 2026-03-29 10:54
研究核心成果 - 厦门大学、OPPO研究院、上海科技大学联合团队提出“运动图灵测试”新标尺,用于评估人形机器人运动的拟人程度,该工作已被CVPR 2026接收并将全面开源[2] - 核心方法是去除所有外观信息,将人类与机器人视频均转换为SMPL-X 3D骨骼模型,仅基于纯粹的运动轨迹进行区分[6] - 测试揭示,当前机器人“不像人”的核心原因在于动作本身的僵硬、断裂与缺乏协调,而非外形[7] 运动图灵测试与HHMotion数据集 - 为支撑测试,研究团队构建了首个直接对比人机运动并聚焦“拟人性”评分的HHMotion数据集[11] - 数据集包含15类动作,涵盖日常与动态动作,总计1000个动作片段,标注时长超过500小时[13][16] - 数据集中包含10位真实人类与11种先进人形机器人(如宇树Unitree、众擎EngineAI PM01)在同一套动作体系下的数据[14] 机器人动作表现分析 - 机器人表现存在明显不均衡:在行走(与人类分差1.31)、坐下(分差1.55)等平缓动作上更接近人类[14] - 在高动态动作上与人类差距显著:跳跃分差达3.23,拳击分差2.53,跑步分差2.26(满分5分)[8][17] - 动态动作困难的原因在于其需要全身协调、重心控制与本能调整,这些是机器人目前所欠缺的[18] 评估模型PTR-Net的性能 - 研究提出的专用模型PTR-Net在评估运动拟人度上显著优于通用多模态大模型[23] - PTR-Net的平均绝对误差仅为0.58,而Gemini 2.5 Pro的MAE最低为1.26,Qwen3-vl-plus的MAE高达1.77[24] - PTR-Net采用双向LSTM捕捉时间节奏、时空图卷积建模关节协调、注意力池化聚焦关键片段,专为细粒度运动特征捕捉设计[25] 最新人形机器人测试案例 - 对2025年底发布的小鹏机器人XPeng IRON进行测试,PTR-Net预测其类人得分为4.25,与人类真实打分4.36高度一致,已接近难以区分的临界水平[29] - 当前一批领先人形机器人(如宇树Unitree G1、小鹏IRON、众擎PM01)在行走、站立等简单节奏动作上已展现出明显的“类人趋势”[33]