Workflow
VLAW框架
icon
搜索文档
击败PI!星动纪元登顶具身奥林匹克,狂揽三项全球冠军
量子位· 2026-04-10 10:02
文章核心观点 - 人工智能与机器人领域存在“莫拉维克悖论”,即对人类而言简单的基础感知与运动技能,对机器而言却异常困难[1][2][3] - Benjie's Olympics赛事是针对“莫拉维克悖论”的终极真实压力测试,旨在检验机器人在真实复杂环境中的自适应与泛化能力,而非固定场景的复现[12][13][14][15] - 中国具身智能公司星动纪元在该赛事中表现卓越,其自研的VLA具身大模型在多项任务中击败美国明星公司Physical Intelligence,刷新世界纪录,展示了强大的技术实力[9][11][37] 赛事背景与特点 - 赛事由前Google机器人专家Benjie Holson创办,旨在挑战机器人完成人类日常的灵巧操作任务,如抹花生酱、洗锅、开锁、翻袜子等[3][5] - 赛事被《科学美国人》评价为“物理智能终极真实压力测试”,核心特质是强制泛化,检验机器人在真实复杂环境中的自适应、自决策能力[12][13][14] - 规则极为严苛:要求全自主(无遥控、无人工介入)、无仿真(必须在真实家庭场景下操作)、环境与物体随机摆放,堪称“闭卷裸考”[17] - 通过网友投票,赛事最终决定只允许可移动的机器人参赛,进一步增加了挑战难度[18][19] 星动纪元赛事表现 - 星动纪元在Benjie's Olympics中一举斩获三项任务全球第一,包括两项金牌难度任务和一项银牌难度任务[9] - 该公司是该赛事目前唯一上榜的中国具身企业,也是唯一一个在比赛中打败了Physical Intelligence闭源模型的参赛者[11] - 在金牌难度任务“剥橘子”中,星动纪元以1分47秒纯手剥完成,比Physical Intelligence使用工具耗时2分46秒快35%,成为首个实现完全无工具纯手剥操作的团队[30][31][33] - 在金牌难度任务“开锁”中,星动纪元以49秒完成,比Physical Intelligence的66秒快25%[30][33] - 在银牌难度任务“翻袜子”中,星动纪元仅使用120个训练样本,以1分04秒完成,样本量比Physical Intelligence的176个少31.8%,速度比其1分33秒快30%[30][34][35] 星动纪元核心技术优势 - 公司自研的VLA具身大模型具备三大关键优势[38][39] - **优势一:强大的基础模型知识迁移能力**,能大幅优化数据利用率,使机器人快速适应新场景,降低研发成本与时间[40][43][44][46] - **优势二:自适应视觉注意力机制**,能自动聚焦并清晰识别钥匙孔、果皮等细小关键目标,克服环境干扰与机器人自身晃动[47][48][49] - **优势三:异步高频推理与短时域规划策略**,使机器人能在执行当前动作时同步预测下一段轨迹,实现快速响应与灵敏调整,应对如翻袜子时的物体形变[51][53][57][58] - 综合这些技术,机器人实现了眼清、手稳、能理解工具使用、双手协同并完成多步骤长时序任务的能力[59][60] 公司技术积累与行业地位 - 星动纪元创始人陈建宇为清华大学交叉信息研究院助理教授、博导,公司于2023年创办[65] - 2024年9月,公司成为全球首个提出分频VLA的团队,领先于Physical Intelligence、Figure、Google、NVIDIA等公司[66] - 2025年,公司自研的ERA-42端到端VLA具身大模型实现了对全尺寸双足人形机器人全身及五指灵巧手的精准控制,成为全球仅有的四家能做到这一点的公司之一[67] - 公司曾与斯坦福大学Chelsea Finn(Physical Intelligence联合创始人)团队合作研发Ctrl-World可控生成世界模型,并在WorldArena榜单中超越谷歌、英伟达获全球第一[62][63] - 公司是唯一与Physical Intelligence进行过两次合作的中国具身公司[63] 技术商业化落地 - 星动纪元的VLA具身大模型已在物流、制造业、商业服务及家庭服务等多个领域实现落地[68] - 合作企业包括物流领域的顺丰,制造业的吉利、北汽,以及商业与家庭服务领域的海尔、联想、世纪金源等[68] - 其智能分拣机器人已能完成药品、日化品、包裹分拣扫码,以及制造业的零部件抓取、高精度装配、质量检测等任务[70][71] - 在商业服务场景,如门店清洁、物品递送、导游导览等,部分场景效率已达到70%~80%[72]