各类任务上超越π0!字节跳动推出大型VLA模型GR-3,推动通用机器人策略发展
具身智能之心·2025-07-22 12:10
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 GR-3的性能与优势 GR-3是字节跳动(ByteDance Seed)研发的大型视觉-语言-动作(VLA)模型,旨在推动通用机器人策略的 发展。该模型能根据自然语言指令、环境观察和机器人状态,生成动作序列控制双臂移动机器人,在新物 体、新环境和抽象指令的泛化能力、少量人类轨迹数据的高效微调,以及长周期和灵巧任务的执行上表现 卓越。 这些能力通过多维度训练方案实现:包括与网络级视觉语言数据的协同训练、基于VR设备采集人类轨迹数 据的高效微调,以及机器人轨迹数据的有效模仿学习。此外,还推出了ByteMini——一款具备卓越灵活性 与可靠性的多功能双臂移动机器人,与GR-3结合可完成多样化任务。大量真实场景实验表明,GR-3在各类 挑战性任务上均超越当前最先进的基线方法π0。我们期待GR-3能推动通用机器人技术的发展,最终实现辅 助人类日常生活的目标 ...