开源数据体系
搜索文档
开源发布 | 乐聚 LET 数据集正式捐赠至 OpenLoong 开源社区,遵循国地中心统一数据标准
机器人大讲堂· 2025-11-25 20:01
文章核心观点 - 乐聚智能将其构建的LET数据集捐赠至OpenLoong开源社区,标志着行业在共建开放可信数据基础设施方面取得重要进展,此举将推动人形机器人模型能力的提升和产业化规模应用 [1] - 高质量、多模态、结构化数据是推动人形机器人技术发展的核心要素,行业需要建立统一的数据规范体系来解决数据分散、格式不一等共性问题 [1][12] - OpenLoong开源社区通过吸纳LET数据集等高质量资源,持续扩展数据生态,为行业提供覆盖基础训练、任务执行和多场景验证的多层次体系,加速行业协同发展 [26] LET数据集内容构成与数据体系 - LET数据集是国内少有的面向真实作业场景的全尺寸人形机器人真机数据集,基于乐聚夸父系列机器人统一采集,规模超过60,000分钟 [2] - 数据集覆盖工业、商业零售和日常生活三大领域,包含汽车工厂、快消场景、酒店服务等六类环境,构建了31项任务和117种原子技能 [4] - 通过组帧技术将传感器时间误差控制在10毫秒以内,数据一致性超过90%,并配套数据转换、模型训练和真机部署工具链 [5][6][7] 行业数据规范体系建设 - 国家地方共建人形机器人创新中心建立了覆盖数据采集、处理、质量审核和版本管理的标准体系,主导或参与国际、国家和行业标准60余项 [14] - 国地中心申报的"上海虚实融合具身智能训练场标准化试点"于2025年9月获批,数据标准编制与应用验证是试点重要任务 [14][20] - OpenLoong依托国地中心经验推进共享型数据框架构建,以开源方式推动数据规范化组织与复用 [20] OpenLoong数据生态发展 - LET数据集已在OpenLoong社区网站开放下载,将在开放原子开源基金会孵化下持续运营更新,为行业提供系统化真实场景数据资源 [22][24] - 社区鼓励具备真实作业场景的企业、高校和研究团队贡献数据,共同完善人形机器人领域开源数据体系 [26] - 随着数据规模增长,OpenLoong将推动多场景、多任务、多模型的协同研究,促进形成开放健康的产业生态 [26]