具身数据
搜索文档
深扒了具身的数据路线,四小龙的格局已经形成......
具身智能之心· 2025-12-24 18:04
文章核心观点 - 具身智能行业正围绕数据采集、模型训练、数据扩展和模型优化的闭环链路发展,数据是当前发展的主线[1] - 行业并非寻求单一最优解,而是在不同阶段和约束下,沿着四条数据路线同时前进[3] - 这四条路线已形成四种具身数据供给范式,并初步形成了以智元、银河、它石、鹿明为首的“具身数据四小龙”格局[4][34] - 2026年行业竞争将加剧,但掌握数据话语权的公司前景看好[5] - 具身智能正从探索阶段走向长期能力迭代,数据体系的重要性从“支撑算法”转变为“决定节奏”[43] 四条核心数据路线及其特点 - **遥控真机数据**:最真实、最昂贵,数据价值密度极高,是研究者的“安全感来源”,但存在慢、贵、强绑定本体、规模扩张成本线性增长等问题,被视为高质量样本但难以大规模供给[6][8][9][10][12][13][14] - **仿真合成数据**:效率高、规模几乎无限,通过技术提升“像真度”,但始终存在与现实世界的“领域鸿沟”,在精细操作和复杂交互中问题会被放大,是很好的“训练场”但难决定真实世界上限[6][16][17][18][19][20][21] - **人类视频数据**:最便宜、数据量巨大、获取成本极低、场景覆盖极广,但易被误解,存在人体与机器人结构不一致、缺少力觉触觉反馈、动作可执行性无保证、标注对齐成本高等问题,通常作为真实交互数据丰富后的“叠加项”而非起点[6][22][23][25] - **UMI数据**:无本体依赖,更通用的数据协议,重新定义了数据与机器人本体的关系,将真实交互数据从特定机器人解耦,实现了真实世界交互、多本体适配、多机并行采集、工业级质量控制及可长期规模部署,让真实数据首次具备持续供给的可能性,正成为重要的具身数据基础设施[6][27][28][30][31] 各路线代表公司及实践 - **遥控真机路线**:海外以特斯拉为代表,国内以**智元机器人**为代表,其开源了百万真机数据集AgiBot World,并支撑了GO-1具身基座大模型和全人形WholeBodyVLA方案[35][39] - **仿真数据路线**:国内以**银河通用**为代表,基于十亿量级仿真数据发布了全球首个全仿真预训练具身大模型GraspVLA及灵巧手抓取数据集DexonomySim[35][39] - **人类视频路线**:海外有Figure AI,国内以**它石智航**为代表,发布了包含10万+真实人类操作视频的WIYH数据集及配套的SenseHub数据采集系统[35][39] - **UMI路线**:海外有Generalist用27万小时真机数据训练Gen0模型验证价值,国内**鹿明机器人**是产业界最早探索该路线的代表,发布了FastUMI Pro系统,使采集效率提升3倍,成本降至传统方案的1/5[35][39] 各数据路线的角色与行业意义 - 遥控真机数据用于**验证能力上限**[40] - 仿真数据用于**放大探索空间**[40] - 人类视频数据用于**扩展语义覆盖**[40] - UMI数据用于**支撑真实世界的长期数据供给**[40] - 四条路线并非互相否定,而是各自承担不同角色,共同构成行业的数据供给结构[38] - UMI路线对团队早期选择与持续投入依赖更强,其积累是路线选择和长期投入的结果[41][42] - “具身数据四小龙”是当前阶段性结构分工的描述,未来优势将取决于哪些团队能在真实世界中持续运行并累积数据[44][45]
圆桌论坛:具身数据如何塑造行业未来?丨GAIR 2025
雷峰网· 2025-12-21 11:05
文章核心观点 - 具身智能行业正处于从技术演示走向规模落地的关键转折期,高质量数据已成为性能突破和成本控制的核心瓶颈 [2] - 数据采集方式正从以政府支持的同构遥操作数采工厂为主,向多元化发展,包括UMI、动捕、仿真及In-the-wild(野外采集)等多种范式 [3][9][18] - 行业处于早期阶段,数据公司、模型公司与本体公司需深度磨合与协作,共同迭代,而非简单的数据买卖关系 [4][6][7] - 中美在具身智能数据领域技术代差不明显,但发展路径因资源禀赋(如地方政府支持)不同而存在差异,可能形成“资源诅咒” [9][12] - In-the-wild数据采集是未来的重要愿景,但目前面临技术、设备、数据质量与人力组织等多重挑战,大规模应用尚需时日 [20][22][23] 数据质量的定义与评估 - 好的数据应以终为始,最终能有效提升模型性能和机器人训练收益 [4] - 数据质量的关键决定因素包括:采集成本、对不同场景和硬件的适应性 [4] - 数据公司需具备模型知识,与客户共同迭代,才能提供高质量数据,而非仅进行体力劳动式的采集 [6][7] 数据采集方式的多元化发展 - 当前主要数据采集方式包括:遥操作、UMI(通用操作接口)、动捕、仿真数据,各种方式“存在即合理”,未来将更加多元化 [3][18] - 中国地方政府大力支持建设以遥操作为主的数采工厂,短期内促进了行业,但可能影响技术路线的多元化探索 [9][16][17] - UMI作为一种跨本体的、以人为中心的数据采集方式,因北美公司(如Sunday Robotics)的推动而受到广泛关注,特别适用于占据中国市场99.9%以上的二指夹爪机器人生态 [11][12][14] - In-the-wild采集是通向通用机器人的关键,但当前技术门槛高,需先解决低摩擦、高精度、多模态的采集设备及从稀疏数据提取稠密信息的技术问题 [3][20][22] 行业协作模式与数据价值 - 行业早期,数据公司与模型/本体公司是相互磨合、共同成长的关系,模型公司需要数据公司的专业建议 [6][7] - 数据与算法不可分割,数据公司需深入理解算法模型,通过采集-训练迭代获得针对特定任务的宝贵经验(know-how和insight) [7][8] - 拥有全链路能力(数据、模型、部署)的垂直场景公司能快速积累经验,但资源要求极高;数据公司可通过与不同场景客户合作,积累跨场景经验而找到生存路径 [26][27][28] 中美发展路径对比与行业现状 - 中美在机器人数据领域没有明显技术代差,共识大于分歧 [9][12] - 主要差异在于资源禀赋:中国有地方政府助力,倾向于投资建设遥操作数采中心;美国缺乏此类支持,促使了如UMI、In-the-wild等更多元采集方式的发展 [9] - 行业仍处非常早期,每年有200亿至300亿美元的资金投入,但技术成熟度远低于当年同等投资规模下的VR、自动驾驶等行业 [24][25] - 最终技术路线尚未收敛,行业参与者均在跟随正确方向探索,数据是其中相对确定的切入点 [26][29] 公司愿景与展望 - 诺亦腾机器人愿景是作为智能化的赋能者,服务于成功的机器人本体公司 [29] - 极数迭代认为从数据切入是行业早期最具确定性的创业机会,旨在跟随最先进方向积累能力 [29] - 鹿明机器人旨在深耕UMI数据采集领域,目标是成为该领域的Top1,并计划在未来2-3年内完成从工厂采集到野外采集的跨越 [30]