Workflow
ByteMini机器人
icon
搜索文档
字节发布GR-3大模型,开启通用机器人“大脑”新纪元
经济观察报· 2025-07-22 15:23
GR-3模型技术特点 - 推出全新Vision-Language-Action Model(VLA)模型GR-3,具备强大泛化能力、抽象概念理解及柔性物体精细操作能力 [2] - 采用Mixture-of-Transformers(MoT)网络结构,整合视觉-语言模块与动作生成模块,形成40亿参数端到端模型 [3] - 通过三合一数据训练法(遥操作机器人数据、人类VR轨迹数据、公开图文数据)显著提升性能,VR数据收集效率比传统方法快近一倍 [3][4] GR-3模型应用表现 - 在未见过物品和环境的通用拾取放置任务中保持高指令遵循率与成功率 [6] - 长程餐桌清理任务中仅凭总指令即可自主完成全流程操作,平均完成度超过95% [6] - 柔性衣物操作任务中稳定完成挂衣动作,展现灵活性与鲁棒性 [6] ByteMini机器人设计 - 配备22个全身自由度及手腕球形设计,可像人类一样灵活操作狭小空间物品 [5] - 搭载全身运动控制系统,动作快速稳定且能自动调整抓取力度避免损坏易碎品 [5] - 配置多颗摄像头(手腕细节捕捉+头部全局观察)确保任务执行准确性 [5] 未来发展方向 - 计划扩大模型规模与训练数据量以提升对未知物体的泛化能力 [7] - 将引入强化学习(RL)突破模仿学习局限,实现机器人自主试错与策略优化 [7] - 目标将GR-3发展为通用机器人"大脑",推动其成为日常生活助手 [7]