Workflow
Gen DAS Ego
icon
搜索文档
GenEgoData—行业首个面向具身世界模型的数据集正式发布
机器人大讲堂· 2026-03-19 12:08
Gen Ego Data数据集的核心特点与优势 - 数据集以“以人为中心”为核心设计理念,聚焦具身智能与世界模型范式,旨在让模型学会“感知-动作-结果”的因果关系与物理规律,而非简单模仿关节角度[1] - 拥有行业最广视野的第一视角全身覆盖,采用6颗RGB摄像头,水平视场角270度,垂直视场角150度,能无遗漏、无遮挡、无畸变地精准捕捉人手细微动作及人体完整姿态[2] - 通过6视角实现高质量的全局环境感知,有效解决遮挡问题,提供更多上下文,并通过交叉验证快速剔除异常标注,提升数据质量[2] - 实现行业最全模态覆盖,包括第一视角、头部姿态、2D/3D手部姿态、上半身23个自由度支持,以及帧级别思维链语义标注[2] - 提供高精度手部关节与2D/3D姿态标注,以及亚毫秒级头手协同精度[2] - 实现行业首个上半身关节检测,填补全身动作采集空白,为构建完整人体动作动力学模型提供关键支撑[2][3] - 构建行业最大规模数据基座,通过海量多样性的自然人类行为数据,推进模型规模化扩展[4] - 提供完整思维链语义标签标注,实现帧级动作分割与视觉、运动、语义的精准对齐,让模型理解动作意图与因果闭环[5] - 数据以“人”为真值,保留了独立于机器人本体差异的可扩展性优势,能适配不同类型、不同规格的具身设备,实现价值持续积累[5] Gen DAS Ego数据采集设备的技术规格与设计理念 - 设备旨在实现“不止可用更要好用”,从感知、成像到佩戴体验均围绕让人类在真实场景中无感、自然地完成操作的目标设计[7] - 搭载6颗200万像素高清摄像头及内置IMU,实现水平270度、垂直150度的超广视野,能精准捕捉人手、全身及头部运动轨迹[7] - 对核心视觉模组进行深度调优,确保在弱光、光线频繁变化等复杂真实环境下,依然拥有稳定、清晰的成像表现,从源头保证数据质量[7] - 通过6个视角应用最小二乘三角化算法,使检测精度和稳定性相比单颗摄像头高数倍,达到行业领先的厘米级精度(双手22个自由度纯视觉精度达1-2厘米)[3][7] - 采用350克轻量化无感设计和磁吸式热插拔电池,支持换电不断电,可进行24小时不间断作业,最大程度还原人类自然行为,保证数据的原生性与真实性[7] - 采用稳固自适配结构,面对不同头维人群能保证外参恒定,实现数据采集标准化[7] - 支持语音交互,解放双手,使数据获取简单易用[7] 数据采集的规模、多样性与应用场景 - 通过无感佩戴,让人不受干扰地进行劳动,记录的行为最为自然、真实[8] - 通过3000个家庭众包进行采集,单个技能或场景的采集时长不超过百小时,有助于模型提炼通用物理规律,避免过拟合,提升在陌生场景的泛化能力[8] - 数据采集已覆盖商超、家庭、工厂、户外等超过20种场景,覆盖超过200种人类技能[8] - 日生产数据片段数量达到10万个[8] - 数据获取产品需满足高质量、稳定、鲁棒的多模态数据获取能力,以及简单、易用、无感的使用体验,以获取人最自然的操作[9] - 数据获取需确保不同类型人群不会造成数据质量差别,并能通过众包方式规模化进入生活家庭,实现最真实、多样的数据[9] - 数据获取需具备快速的数据流转能力,以形成真正意义上的数据飞轮[6] 行业定位与发展愿景 - 高质量数据是连接人类行为与机器人智能的关键桥梁,是具身智能让机器人理解并复刻人类与物理世界自然交互能力的核心[10] - Gen Ego Data的发布是公司在具身智能数据生态布局上的重要一步[10] - 未来,公司将持续深耕“以人为唯一真值”的数据理念,不断丰富数据集的场景与任务覆盖,构建持续生长、动态更新的高质量数据体系[10] - 公司将依托Gen DAS系列硬件技术优势,为行业伙伴提供更稳定、高效、贴合真实需求的数据服务,与行业同仁共同推动具身智能技术快速落地[10] 相关产业链企业列举(摘要) - 文章列举了工业机器人、服务与特种机器人、人形机器人、具身智能企业、医疗机器人企业及上游产业链等多个领域的众多相关公司[14][15][16][17][18][19]