Workflow
国泰海通:字节推出GR-3模型 泛化性显著提升 建议关注产业链相关标的
智通财经网·2025-07-25 15:03

字节跳动GR-3机器人模型发布 - 字节跳动Seed团队发布通用机器人模型GR-3,该模型为VLA架构,具备泛化到新物体和新环境的能力,能理解包含抽象概念的语言指令,还能够精细地操作柔性物体 [1][2] - GR-3模型与GR-2模型相比,在面对新环境和新物体时操作性能卓越,复杂指令理解精准度高,具备处理泛化任务的能力 [1][2] - GR-3在泛化性、复杂任务的成功率上比业内头部具身大模型π0显著提升,在新物品操作的成功率上较π0高出17.8% [1][4] GR-3模型技术特点 - GR-3采用MoT+DiT的网络结构,将"视觉-语言模块"和"动作生成模块"集成为40亿参数的端到端模型,生成动作后通过RMSNorm增强动态指令跟随能力 [2] - GR-3采用三合一数据训练法:遥操作数据(高质量)、人类VR轨迹数据(低成本,可达450条数据/小时),公开图文数据(理解抽象概念、认识新物体以提升泛化能力) [2] - GR-3仅需10条人类轨迹数据即可将新物体操作成功率从60%提升至80%以上 [4] 配套硬件ByteMini机器人 - 为充分发挥GR-3的潜力,同步推出通用双臂移动机器人ByteMini,具备22个全身自由度与独特手腕球角设计,实现接近人类手腕的灵活转动能力 [3] - ByteMini配备多摄像头协同系统(2手腕摄像头+头部全局视角),确保操作过程中的"眼观六路" [3] - 采用全身运动控制(WBC)系统实现平滑轨迹生成,在抓取纸杯等场景中自动调整力度,避免传统机器人的刚性碰撞问题 [3]