Energy-Based Transformer (EBT)
搜索文档
如果Policy模型也能动态思考推理,是否能让机器人在真实世界中表现得更好?
具身智能之心· 2025-11-13 10:05
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 如果策略模型也能动态地思考与推理,尤其能理解"不确定性",是否能让机器人在真实世界中表现得更好? ⚡️ 研究简介:EBT-Policy 近期,研究团队提出了 EBT-Policy(Energy-Based Transformer Policy) ,一种基于能量模型(Energy-Based Model, EBM)的新型策略架构。 该方法在模拟与真实机器人任务中均表现出色,显著提升了训练和推理效率,并展现出独特的「零样本重试(zero-shot retry)」能力。 主要特点: ✍️ 什么是 Energy-Based Transformer (EBT)? EBT 模型通过学习一个 能量值 energy 来衡量输入变量之间的匹配程度。 在语言建模任务中,它学习的是上下文与预测之间的能量地形(energy landscape)。 ⚙️ 在模拟与真实环境中 ...