Workflow
夸父全尺寸人形机器人
icon
搜索文档
开源!国内规模最大的全尺寸人形机器人真机数据集!哪里值得关注
机器人大讲堂· 2025-11-24 16:31
文章核心观点 - 全球首个面向真实作业场景的全尺寸人形机器人真机数据集“LET数据集”正式发布并开源首批超过60,000分钟数据 [1] - 该数据集旨在解决人形机器人及具身智能领域高质量、大规模、标准化真实世界操作数据极度稀缺的核心痛点 [1] - LET数据集有望驱动行业从“机械执行”到“自主理解与推理”的范式革命 [1] 人形机器人数据稀缺的原因 - 真机数据采集成本高昂,双足机器人每小时仅能采集三到四条有效数据,单条成本高达近二十元 [4] - 即便采用先进设备,百台机器人日数据产出仅为八到十万条,且面临设备周期短、单机投入高的困境 [4] - 依赖人工采集年成本轻易逼近三十万元 [4] - 行业数据生态处于“碎片化”状态,各机构数据格式不一、质量标准参差,形成“数据孤岛” [4] - 仿真数据与真实世界存在“物理鸿沟”,训练出的模型在现实场景中鲁棒性和迁移能力远低于预期 [3] LET数据集的关键特性与优势 - 数据集规模超过六万分钟,基于乐聚“夸父”全尺寸人形机器人真机采集,具备四十多个自由度 [5] - 数据一致性提升至百分之九十以上,时间戳误差严格控制在十毫秒以内 [7] - 构建深度融合的多模态体系,囊括清晰视频流、RGB图像、深度图、关节状态及末端执行器状态等关键信息 [7] - 全面覆盖工业、商业零售与日常生活三大核心领域,细致落地到汽车工厂、3C电子工厂等六大真实作业场景 [8] - 覆盖三十一项关键任务与一百一十七种原子技能,包括抓取放置、多臂协作到工具使用 [8] - 配套提供涵盖数据转换、模型训练、仿真测试与真机部署的全流程工具链,降低使用门槛 [10] 行业影响与未来展望 - LET数据集为验证并推动人形机器人的“缩放定律”提供了坚实基石 [11] - 加速了VLA模型从虚拟仿真到现实应用的落地进程 [11] - 以高标准共建为起点,积极推动国家及行业标准的研制与实施 [11] - 有望开启由数据共享驱动技术迭代,再由技术迭代反馈应用优化的良性循环 [11] - 将加速中国人形机器人从技术突破走向规模化量产的进程 [11]