Workflow
成本相差200倍!遥操作、仿真、UMI、视频学习,谁才是具身智能数据领跑者?
机器人大讲堂·2025-10-03 12:04

2025 年具身智能行业投融资热度持续攀升,行业内已形成明确共识:要实现从 L1 特定任务具身智能到 L2 组合任务具身智能的技术跨越,乃至向更高阶通用能力迈进,数据采集是必须突破的核心环节。 不同于语言、图像等低维数据的获取,具身智能需要的是物理世界绝对坐标系下的精确测量数据,其获取难 度、成本投入与标注周期,都远超传统模型训练需求。 具身智能的核心目标,是让机器人在物理世界中具备 "举一反三" 的常识理解能力,面对未曾接触过的物体和 任务,能像人类一样依托过往经验推导操作逻辑。而这一能力的构建基础,正是高质量、多模态的交互数据。 当前国内头部企业仍处于 L1 前期发展阶段,可完成特定环境下的单工位操作任务;而 π0.5 模型通过融合操 作数据、网络数据、语言指令等多源信息的预训练方式,在家庭真实环境长程任务中的准确率已突破 60%, 接近 L2 水平。 行业普遍认为,预训练是具身智能技术进阶的核心,而预训练效果直接取决于数据的 "量" 与 "质":一方面, L1 级模型已需 1 万小时 + 的数据量支撑训练,且 Scaling Law 规模定律在具身智能领域仍未见顶,数据规 模的扩大仍能持续推动模型性能提 ...