Workflow
UMI(Universal Manipulation Interface)
icon
搜索文档
圆桌论坛:具身数据如何塑造行业未来?丨GAIR 2025
雷峰网· 2025-12-21 11:05
文章核心观点 - 具身智能行业正处于从技术演示走向规模落地的关键转折期,高质量数据已成为性能突破和成本控制的核心瓶颈 [2] - 数据采集方式正从以政府支持的同构遥操作数采工厂为主,向多元化发展,包括UMI、动捕、仿真及In-the-wild(野外采集)等多种范式 [3][9][18] - 行业处于早期阶段,数据公司、模型公司与本体公司需深度磨合与协作,共同迭代,而非简单的数据买卖关系 [4][6][7] - 中美在具身智能数据领域技术代差不明显,但发展路径因资源禀赋(如地方政府支持)不同而存在差异,可能形成“资源诅咒” [9][12] - In-the-wild数据采集是未来的重要愿景,但目前面临技术、设备、数据质量与人力组织等多重挑战,大规模应用尚需时日 [20][22][23] 数据质量的定义与评估 - 好的数据应以终为始,最终能有效提升模型性能和机器人训练收益 [4] - 数据质量的关键决定因素包括:采集成本、对不同场景和硬件的适应性 [4] - 数据公司需具备模型知识,与客户共同迭代,才能提供高质量数据,而非仅进行体力劳动式的采集 [6][7] 数据采集方式的多元化发展 - 当前主要数据采集方式包括:遥操作、UMI(通用操作接口)、动捕、仿真数据,各种方式“存在即合理”,未来将更加多元化 [3][18] - 中国地方政府大力支持建设以遥操作为主的数采工厂,短期内促进了行业,但可能影响技术路线的多元化探索 [9][16][17] - UMI作为一种跨本体的、以人为中心的数据采集方式,因北美公司(如Sunday Robotics)的推动而受到广泛关注,特别适用于占据中国市场99.9%以上的二指夹爪机器人生态 [11][12][14] - In-the-wild采集是通向通用机器人的关键,但当前技术门槛高,需先解决低摩擦、高精度、多模态的采集设备及从稀疏数据提取稠密信息的技术问题 [3][20][22] 行业协作模式与数据价值 - 行业早期,数据公司与模型/本体公司是相互磨合、共同成长的关系,模型公司需要数据公司的专业建议 [6][7] - 数据与算法不可分割,数据公司需深入理解算法模型,通过采集-训练迭代获得针对特定任务的宝贵经验(know-how和insight) [7][8] - 拥有全链路能力(数据、模型、部署)的垂直场景公司能快速积累经验,但资源要求极高;数据公司可通过与不同场景客户合作,积累跨场景经验而找到生存路径 [26][27][28] 中美发展路径对比与行业现状 - 中美在机器人数据领域没有明显技术代差,共识大于分歧 [9][12] - 主要差异在于资源禀赋:中国有地方政府助力,倾向于投资建设遥操作数采中心;美国缺乏此类支持,促使了如UMI、In-the-wild等更多元采集方式的发展 [9] - 行业仍处非常早期,每年有200亿至300亿美元的资金投入,但技术成熟度远低于当年同等投资规模下的VR、自动驾驶等行业 [24][25] - 最终技术路线尚未收敛,行业参与者均在跟随正确方向探索,数据是其中相对确定的切入点 [26][29] 公司愿景与展望 - 诺亦腾机器人愿景是作为智能化的赋能者,服务于成功的机器人本体公司 [29] - 极数迭代认为从数据切入是行业早期最具确定性的创业机会,旨在跟随最先进方向积累能力 [29] - 鹿明机器人旨在深耕UMI数据采集领域,目标是成为该领域的Top1,并计划在未来2-3年内完成从工厂采集到野外采集的跨越 [30]