Workflow
ControlVLA
icon
搜索文档
CoRL 2025最新工作!ControlVLA:机器人看10遍就会,“通智大脑”能力再升级!
具身智能之心· 2025-09-25 17:54
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Puhao Li等 编辑丨 具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 成果简介 ControlVLA 利用现有大规模机器人操作数据集预训练VLA模型模仿人类操作动作,通过 ControlNet 风格的架构将预训练的 VLA 模型与以对象为中心的表示连接 起来,以针对具体的任务实现高效的微调(如图1所示)。具体来说,为了在不覆盖先验知识的情况下引入以对象为中心的条件,ControlVLA 对一组投影层进行 零初始化,使得它们能够逐步微调预先训练的操作策略,进而高效泛化与执行新的任务。 图1:ControlVLA预训练与微调阶段 一、研究背景 近年来,预训练VLA (Vision-Language-Action) 模型展现出极大的潜力,但要让机器人学会新任务,仍需依赖大规模、精确的动作序列。为解决这一问题,北京 通用人工智能研究院联合星尘智能等单位提出了一种物体中心表征的微调框架——Cont ...