Workflow
GroceryVLA零售端到端大模型
icon
搜索文档
银河通用创始人王鹤勾勒人形机器人产业新图景,合成数据破局具身智能落地
新浪证券· 2025-06-28 17:03
行业动态 - "具赋新能 智驱未来"青年科学家成果转化暨具身智能高质量发展研修会在上海智能工业中心开幕,百余位全球青年科学家与逾130位上市公司企业家参会 [1] - 具身智能作为让机器人具备理解物理世界并与之交互能力的尖端领域,近年来风头正劲,尤其在多模态大模型加持下,"端到端"的技术路线被视为通向"通用"的曙光 [3] - 具身智能的任务范畴比自动驾驶更广、所需数据量级更大、技术复杂度更高,但"端到端"之路依然值得坚持 [3] 技术突破 - 银河通用通过构建庞大的仿真合成数据集,生成海量虚拟操作轨迹与标签,攻克"仿真-真实"差距难题,打造出基于合成大数据预训练的端到端具身大模型 [5] - "GraspVLA"模型是全球首个完全依靠合成数据(10亿帧)预训练的视觉-语言-动作(VLA)大模型,在仿真环境中模拟了桌面场景下对近百万种物体的抓取 [7] - 模型能在完全未见过的真实环境与物体中仅凭语言指令就完成精准抓取,具备闭环实时动态调整能力和强抗干扰性 [7] - 合成数据方案带来革命性效率提升:仅需每人约2小时采集的200条真实数据微调,模型即可精确理解人类意图,并能零样本泛化到同类新物品 [9][10] 商业化应用 - 银河通用落地全球首个人形机器人智慧零售解决方案,由具身大模型机器人Galbot在实体门店中执行取货、送货、打包、库存管理等无人值守工作 [14] - 新门店部署仅需两天,无需数据采集,北京已有10家类似药店成功运行,并获100家药店订单,计划在北上广深快速部署至百家 [15] - 饮品店、咖啡店已投入运营,单日约400多单,失败率控制在极低的单日≤1单 [15] - 工业领域应用包括:国际车厂北京工厂的复杂零部件分拣任务,处理3x3x3复杂垛型的料箱搬运工作 [15] 数据挑战 - 全球最大具身智能数据集仅达百万条级别,与自动驾驶的单日数据量(头部车企单日可回流高达1亿条片段)相比相差数个量级 [4] - 人形机器人公司今年量产目标仅定在"超过1000台",离"一万台"仍有距离,与汽车百万级保有量相差两个数量级 [4] - 机器人的自由度(单臂6-7个,全身50-100个)远超汽车,意味着对数据的需求成倍增长,采集成本高昂(单人单日约采1000条) [4]