Workflow
VPP(Video Prediction Policy)算法框架
icon
搜索文档
专治Demo玩家:「具身灵巧操作奥林匹克」大赛三项第一,全被国内这家公司拿下
机器之心· 2026-04-10 11:50
文章核心观点 - 星动纪元在具身智能顶级赛事Benjie's Olympics中,击败行业公认的技术领先者Physical Intelligence,在开锁、剥橘子、翻袜子三项核心任务中均获得全球第一,证明了其技术实力和全栈能力在真实场景下的优越性 [9][11][22][34][38] - 该赛事以硬核、实战著称,旨在终结行业“Demo表演”文化,其成绩直接反映了当前具身智能领域的全球最高水平,星动纪元是唯一上榜的中国企业 [19][24][27][29] - 星动纪元凭借其自研VLA具身智能模型在样本效率、感知精度和控制响应等关键环节实现突破,展示了比国际顶尖同行更有效的解决具身智能核心难题的方法论 [46][48][58] 赛事背景与含金量 - Benjie's Olympics由前谷歌机器人专家发起,旨在撕下行业包装,将评判标准拉回实用落地层面,被誉为“机器人行业的压力测试” [27][28] - 赛事汇聚了Physical Intelligence、Sunday Robotics等全球顶尖公司,是PI唯一主动参赛并出动其未公开闭源旗舰模型π*0.6的赛事 [20][28] - 赛事设有15项实战挑战,按难度分金银铜牌,开锁和剥橘子为金牌难度,翻袜子为银牌难度,任务容错率极低(1-3mm),要求机器人全自主、零人工干预、无仿真,环境和物体随机摆放 [29] - 业内专家共识认为该赛事是唯一强制泛化而非复现的比赛,多数队伍连铜牌都难以通过,金牌任务近乎奇迹 [31] - 行业形成新评判标准:能通过Benjie's Olympics考验的才叫“工业级全栈”,否则只是“Demo” [33] 星动纪元参赛成绩详情 - **总体成绩**:在翻袜子(银牌难度)、开锁、剥橘子(金牌难度)三项任务中均位列全球第一,全面刷新世界纪录 [11] - **击败对手**:击败了行业公认的技术领先者Physical Intelligence,后者派出了从未公开过的核心闭源模型π*0.6 [17][20] - **剥橘子任务**:成为该赛事首个实现完全无工具、纯手剥操作的团队,用时1分47秒,比使用削皮刀的PI(2分46秒)快35% [41][42] - **开锁任务**:在存在金属反光等视觉干扰下,用时49秒顺利开锁,比PI(66秒)快25% [43][44] - **翻袜子任务**:仅使用120个训练样本,比PI的176个样本少32%,且执行速度更快,用时1分04秒,比PI(1分33秒)快30% [45] 星动纪元VLA模型的技术优势 - **极高的样本效率**:在翻袜子任务中,仅用120组样本就达到甚至超过了PI使用176组样本的表现,样本量减少约32%,展现了强大的小样本学习和知识迁移能力 [45][49] - **自适应视觉注意力机制**:在开锁等精细操作中,能动态聚焦关键区域,增强微小目标特征,在高干扰环境下保持稳定的感知能力,为毫米级精度操作提供基础 [51][53] - **异步高频推理与短时域规划**:引入异步推理与短时域规划机制,提升决策频率,使机器人能更高频地修正动作,及时响应环境变化,抑制误差累积,提升任务成功率与稳定性 [53][55] - **综合能力验证**:模型在柔性物体操作、双手协作、工具使用及长程复杂任务等关键能力上实现同步提升,其全栈能力在极端压力下得到整体验证 [35][37][56] 公司的行业地位与技术引领 - **研究范式引领**:公司与斯坦福大学团队联合发布的Ctrl-World可控生成世界模型,在世界模型权威评测World Arena榜单上击败谷歌、英伟达等模型,在四大核心维度登顶 [61] - **技术首创**:是全球首个提出分频VLA架构(HiRT快慢分层架构)的团队,早于PI、Figure、谷歌、英伟达等公司 [63] - **技术首创**:打造了全球首个融合世界模型的具身大脑VPP算法框架,将可用数据扩展到海量互联网视频数据 [63] - **技术标杆**:其研发的ERA-42模型,是全球仅有的四个实现了全尺寸人形机器人全身及五指灵巧手精准控制的标杆之一,其余三家为Figure Helix、特斯拉Grok及英伟达GR00T [63] - **实际落地**:ERA-42具身大脑已在物流分拣及扫码、制造零部件抓取、高精度装配、质量检测以及商业服务等真实场景中落地,部分场景效率达70%~80% [62]