Egocentric-10K数据集发布 - 发布了有史以来最大的人类为中心(human-centric)数据集Egocentric-10K,包含10亿帧画面,来自2153名工人在真实工厂中总计10000小时的工作[2][11] - 其规模是同类知名数据集EPIC-KITCHENS的100倍,是首个完全在真实工厂中收集的数据集,将数据场景从家庭扩展至工厂车间[4][11] - 数据集总视频片段达19.2万个,大小达16.4TB,发布不到三天在Hugging Face的下载量就突破1.3万次并登顶趋势榜[5][6][11] 数据集的技术规格与特点 - 在手部可见性和主动操作密度方面领先:96.42% 的帧包含至少一只手,76.34% 的帧包含双手,主动操作占比达91.66%,显著高于Ego4D和EPIC-KITCHENS数据集[5][15][16] - 数据收集使用头戴式摄像设备,规格为1080p、30fps、128°×67°视场角,相比许多旧数据集(720p、60~90° FOV)有提升[17] - 目前数据集仅包含RGB视频信息,暂时缺乏深度、音频、触觉等多模态信息[18] Human-Centric技术路线与行业布局 - 该数据集押注“人类数据”路线,核心在于强调人类操作数据向机器人的迁移价值,旨在让机器人学习更灵巧、更符合直觉的操作技能[25] - 相比真机(robot-centric)数据,human-centric路线的优势在于数据获取成本更低、扩展速度更快[26] - 该路线需克服“人机动态鸿沟”,即人手与机械臂在关节、动力学、传感模式上的系统性差异[27] - 在该赛道上,特斯拉、Figure(Project Go-Big项目)以及国内的它石智航等公司均有布局[25] 数据集背后的公司Build AI与创始人 - 数据集由18岁的连续创业者Eddy Xu的初创公司Build AI发布[8][9] - Build AI专注于构建可扩展、具有经济价值的人类中心数据集,强调从“量”上突破[32] - 公司计划于2026年在深圳的制造工厂生产数百万副记录眼镜,以实现全球覆盖并可能覆盖更多模态信息[22] - 创始人Eddy Xu半年前从哥伦比亚大学辍学,放弃了超过2500万美元的股权投资,全身心投入AI创业[31] 市场反响与潜在挑战 - 数据集发布后受到社区欢迎,网友纷纷点赞[7] - 有网友对大规模工厂数据的实际可用性提出质疑,包括场景多样性是否足够、人类实操经验如何有效迁移至机器人系统等核心问题[24] - 关于human-centric与真机等技术路线谁能更快抵达通用机器人智能的“临界点”,仍需时间与数据规模验证[28]
18岁华人开源成果,火爆具身智能赛道
量子位·2025-11-17 10:51