AA2
搜索文档
王兴兴:“如何迈过具身智能的ChatGPT时刻”?
阿尔法工场研究院· 2026-03-19 12:06
文章核心观点 - 运动智能是机器人能够“干活”的基础与前提,必须足够稳定和多样化,公司同步推进运动能力和操作能力的研发 [1] - 行业质变的临界点是“具身智能的ChatGPT时刻”,即机器人能在约80%的陌生场景中,通过语言或文字指令完成约80%的任务,无需预先针对该场景进行训练 [1] - 当前行业面临模型表达能力不足、真机数据稀缺与利用率低、强化学习缺乏规模效应等核心挑战 [1] - 未来技术方向看好基于世界模型或视频生成模型的发展路径,公司已开源相关模型,但面临视频生成与机器人执行精确对齐的挑战 [2] - 人形机器人行业的快速发展是全球产学研各界共同努力的结果,公司强调开源与合作,认为具身智能的突破需要全球合作 [2] 公司技术进展与产品 - 公司在机器人软件算法上取得显著进步,实现了任意姿态下的摔倒自恢复能力以及高成功率的全身动作控制(如后空翻) [3] - 2026年(去年)在AI方面进行了多项升级,包括更复杂的运动能力和操作技能 [3] - 公司已推出多款代表性机器人产品:包括小巧、高性价比、高自由度的经典机器人“G1”;中型工业级机器狗AA2;1.8米大尺寸、适合体力劳动的人形机器人H2;以及负载能力强、防水的小型机器狗AS2 [2] 行业现状与挑战 - 模型表达能力不足:现有模型难以生成和执行丰富、复杂、实时的动作 [1] - 数据稀缺与利用率低:相比语言模型,机器人领域的真机数据稀缺,主张提高对多元数据(如互联网视频、仿真数据)的利用率,减少对海量、高质量真机数据的依赖 [1] - 强化学习缺乏规模效应:当前训练数据难以复用,每次学习新任务都需重新训练,未能积累形成指数级的“雪球效应” [1] 未来技术方向与行业生态 - 未来技术方向看好基于世界模型或视频生成模型的发展路径,这类模型可以利用海量的互联网视频和文本数据,天花板更高 [2] - 公司已于2025年开源了一个基于视频生成的世界模型 [2] - 强调行业生态与合作,认为具身智能的突破需要全球合作,无论哪家公司或国家率先实现,对整个行业都是巨大的利好 [2] - 公司致力于开源与合作,定期开源算法、数据集和代码,并建立了社区供大家分享与协作 [2] 公司市场认可与展示 - 公司产品与团队获得了包括《时代周刊》在内的重要认可 [3] - 在2026年央视春晚上展示了机器人表演中国传统武术的节目,广受好评 [3]