Workflow
交互演示强化学习
icon
搜索文档
机加篮球有没有搞头?港科大解锁全球首个真实篮球机器人Demo!
具身智能之心· 2025-11-26 08:05
技术突破与核心观点 - 香港科技大学研究团队展示了全球首个能在真实场景中完成篮球动作的机器人demo,标志着具身智能在复杂物理交互任务上的重大进展[5][50] - 该技术突破基于团队此前在仿真环境中的系列研究,包括PhysHOI、SkillMimic和最新的SkillMimic-V2,实现了从虚拟仿真到现实应用的快速跨越[7][36][50] - 核心技术创新在于解决了从稀疏、含噪且覆盖不足的演示数据中学习鲁棒且可泛化交互策略的难题[11] SkillMimic-V2技术细节 - SkillMimic-V2通过引入拼接轨迹图(STG)、状态转移场(STF)和自适应轨迹采样(ATS)三大关键技术,有效应对演示数据的稀疏性、不连贯性和噪声问题[11][14][22] - 在困难技能(如上篮Layup)上的成功率从0%显著提升至91.5%,技能转换成功率(TSR)从2.1%飙升至94.9%,性能提升显著[26][27] - 该方法能够实现运球到投篮等复杂技能间的自然转换,并具备从干扰状态中恢复的能力,展现出强大的鲁棒性和泛化性[21][24] SkillMimic技术框架 - SkillMimic框架采用统一HOI模仿奖励与分层技能复用架构,在单一奖励配置下成功训练出掌握多样化篮球技能的交互策略[30][32] - 基于构建的BallPlay-V和BallPlay-M数据集(约35分钟篮球交互数据),该方法在运球、上篮等任务上的成功率(如79.6%和99.1%)显著高于DeepMimic和AMP等传统方法[33][34] - 分层架构包含低层的交互技能策略和高层的高级控制器,能够有效组合基础技能以完成长程复杂任务[32] 技术演进与基础研究 - PhysHOI作为早期工作,提出了基于物理仿真的动态人-物交互模仿学习框架,并引入接触图(Contact Graph)概念以优化运动学模仿奖励[36][38][43] - 系列研究的核心研究人员王荫槐(香港科技大学博士)在PhysHOI、SkillMimic和SkillMimic-V2中均担任关键角色,体现了技术发展的延续性和深度[46][49] - 技术发展速度迅猛,从2023年的仿真环境研究快速推进至真实环境中的机器人演示,显示出该领域强大的创新活力[50]
1米3宇树G1完美上篮!港科大解锁全球首个真实篮球机器人Demo
量子位· 2025-11-24 17:30
机器人篮球技能突破 - 全球首个能在真实场景中完成篮球动作的机器人demo由香港科技大学团队研发,基于宇树G1机器人实现三步上篮等丝滑动作[1][3][4] - 机器人通过SkillMimic-V2技术解锁"现实世界打篮球"技能,虽未达NBA水平但已接近"村BA"首发标准[3][7] SkillMimic-V2技术核心 - 技术旨在解决交互演示强化学习中演示轨迹稀疏、含噪、覆盖不足的难题,通过拼接轨迹图、状态转移场、自适应轨迹采样提升鲁棒性[9][11] - 拼接轨迹图在不同演示轨迹间寻找相似状态并建立连接,状态转移场从参考轨迹邻域采样以学习恢复能力,自适应轨迹采样动态调整难学片段的采样概率[21][22] - 实验显示困难技能(如Layup)成功率从0%提升至91.5%,技能转换成功率从2.1%飙升至94.9%[25][26] SkillMimic前作技术 - SkillMimic入选CVPR 2025 Highlight,通过统一HOI模仿奖励与接触图技术,在单一奖励配置下训练出精准接触控制能力[27][29] - 采用分层学习架构,低层学习运球、上篮等基础技能,高层复用技能完成复杂任务,成功率显著高于DeepMimic和AMP[31][33] 技术演进与数据集 - PhysHOI为2023年基础框架,通过物理仿真模仿动态人-物交互,引入接触图防止运动学奖励陷入局部最优[34][36][39] - 研究构建BallPlay数据集(含35分钟篮球交互数据),支撑技能学习并在不同篮球尺寸上展现鲁棒性[32][40][42] 研发背景与进展 - 核心研究人员王荫槐(港科大博士)连续主导PhysHOI、SkillMimic系列工作,被称"篮球科研第一人"[43][45] - 从2023年仿真环境测试到真实环境应用,技术迭代速度显著,体现机器人本体发展与算法协同进步[46]