行业核心挑战 - 机器人实现广泛应用的关键在于其“泛化能力”,即适应新环境、新任务的能力[1] - 当前行业的核心痛点是“分布外泛化”问题,即机器人在训练场景外表现不佳,成为具身智能落地的最大障碍[3][4] - 传统AI与强化学习模型的问题在于只学会了表面的“相关性”,而未能掌握事物背后的“因果性”,导致其容易受到环境噪音(如背景颜色、光照变化)的干扰,无法举一反三[2][5][7] 技术核心突破 - 原力无限与多所大学联合完成的研究《DSAP: Enhancing Generalization in Goal-Conditioned Reinforcement Learning》被顶级人工智能会议AAAI 2026收录,标志着因果推理技术被成功引入具身智能领域[2] - 研究首次提出基于“因果图”的结构感知代理框架,该框架强制AI区分“状态无关变量”(如背景颜色、光照)和“状态相关变量”(如物体形状、位置),从而构建结构化的因果世界观[9][10] - 通过引入“解耦结构感知代理”,算法在数学层面切断了环境噪音对决策干扰的“虚假关联”,使AI决策专注于核心因果因素[12][13] - 算法学习到的因果结构与真实物理规律高度一致,证明其具备了结构化认知能力[15] - 在Alchemy和机械臂操作等复杂任务的验证中,搭载DSAP算法的智能体在面临全新环境配置时表现出惊人的稳定性[16][18] - 在视觉背景剧烈变化的测试中,DSAP的成功率显著优于GoFar、CORL等现有最先进算法[19] - 在多种分布外测试设置下,DSAP算法的平均回报率显著高于其他基准算法,展现出强大的泛化稳定性[21] - 这证明引入因果机制后,机器人开始具备初步的逻辑推理能力,而不仅是像素级的模式匹配[22] 公司战略与产学研协同 - 该顶会论文是产学研深度融合的典范,原力无限不仅提供了关键场景认知,也验证了其核心技术战略的前瞻性[24][25] - 公司研究团队致力于构建具有“因果世界模型”能力的超级大脑,DSAP所探讨的“因果泛化”是公司Hyper-VLA大模型进化的必经之路[25] - 通过与香港大学、澳门大学、武汉大学等顶尖学术力量合作,公司构筑了开放、前沿的科研生态系统[25] - “高校理论创新+企业场景验证”的模式加速了前沿算法的验证周期,使公司的技术底座始终保持在学术界最前沿[25]
AAAI 2026重磅!原力无限攻克具身智能“泛化”顽疾,定义因果AI新范式
具身智能之心·2025-12-23 08:03