Workflow
仿真合成数据
icon
搜索文档
本体无关:Generalist 27万小时要掀真机采集场桌子
36氪· 2025-11-14 08:17
数据竞赛的关键分水岭,已不再是数据方案的路线之争,而在于是否回归到数据采集的"第一性原理":追求可复用、可扩展、可演进的规模化 数据流。那些执着于单一本体、高成本标注的传统遥操模式,不仅难以支撑Scaling Law所需的数据洪流,更在根本上背离了智能泛化的基本 逻辑。 图片来源:Generalist 27万小时是什么概念? 这一数据量远超目前公开的所有本体机器人数据集,且仍在以每周1万小时的速度增长。与此形成鲜明对比的是,一度被视为"金字塔尖"的存在的真机遥 操数据采集模式在效率上陷入了难以逾越的瓶颈,其缓慢的积累速度使其根本无法满足Scaling Laws对数据规模的指数级需求。 真机遥操数据的采集,本质上是一种受限于物理世界的线性积累过程。其典型模式是围绕特定机器人硬件,建立线下数据工场,由操作员通过遥操作真实 机器人进行任务演示。这种模式的几个内在特性,决定了其难以跟上Scaling Law的步调: 线性增长与指数需求的对立:Scaling Law揭示,模型性能随着数据规模呈幂律提升,这意味着需要数据量能持续指数级扩张。然而,真机遥操数据采集 严重依赖"堆人头"和实机运行,其增长是线性的。每一个数据点 ...
走进冠军企业银河通用:今年重点落地零售场景
新京报· 2025-08-31 16:58
"这是您的商品。" 屏幕下单,从机器人Galbot G1手里取走商品,中关村大融城附近的银河通用太空舱模仿便利店开启 了"不打烊"模式。 近日,由北京市委网信办主办、新京报贝壳财经承办的"京彩不设限·经济热力站"月度主题走访活动第 三期成功举办。本次活动以"新质先锋 未来北京"为主题,聚焦北京机器人产业开展线下集体采访,共 有15家市属新闻网站、财经类网站等媒体记者,以及财经领域网络大V等参与活动。 并且,数据采集耗时长。据银河通用测算,训练机器人快速掌握一项技能需要上亿条数据,而且在现有 技术条件下,一天能采集500到600条数据,全年大约能采集1000万条数据,"这已经算相对不错的水 平"。 "行业目前主要存在两种解决机器人数据匮乏问题的方案,其中之一是通过视频学习。"曾辉说。但他认 为视频学习的方式可能会导致从2D视频到3D世界的过程中数据出现损耗,对机器人来说这会降低数据 的质量。 这些企业在今年8月北京举办的2025世界人形机器人运动会中代表"北京队"狂揽15个冠军。其中,银河 通用是"医院场景-药品分拣技能竞技"金牌得主。 代表银河通用出征药品分拣场景赛的正是Galbot G1,它不仅可以在药房里 ...