具身智能数据
搜索文档
 海天瑞声:已与多家机器人本体厂商展开合作
 格隆汇· 2025-11-03 15:43
格隆汇11月3日丨海天瑞声(688787.SH)在投资者互动平台表示,公司非常看好具身智能数据领域作为高 增长的新兴赛道,已经组建具身智能数据专项团队开展相关业务,并开始在全国多个城市启动专项公司 的选址设立。 一方面,国家已将具身智能列为未来产业予以重点培育。另一方面,控制机器人认知决 策等"大脑"仍处于发展早期,大模型在泛化能力上仍有不足,因此想实现规模化落地将依赖大量高质 量、细颗粒度的训练数据,因此这一领域市场潜力巨大。 当前,国内、外多家头部科技企业已启动具 身智能数据的规模采购,需求涵盖机器人在真实场景下的交互数据、构建仿真世界模型所需数据等。同 时,部分地方政府也在积极规划建设"具身智能训练场",旨在采集高质量数据,赋能科研与产业应用。 目前,公司已与多家机器人本体厂商展开合作,并与多家头部科技大厂及地方政府启动订单需求对接, 正在推进相关样例数据交付与训练场方案的设计与落地,为下一步具身智能数据业务的加速发展奠定坚 实基础。 ...
 海天瑞声(688787.SH):已与多家机器人本体厂商展开合作
 格隆汇APP· 2025-11-03 15:43
格隆汇11月3日丨海天瑞声(688787.SH)在投资者互动平台表示,公司非常看好具身智能数据领域作为高 增长的新兴赛道,已经组建具身智能数据专项团队开展相关业务,并开始在全国多个城市启动专项公司 的选址设立。 一方面,国家已将具身智能列为未来产业予以重点培育。另一方面,控制机器人认知决 策等"大脑"仍处于发展早期,大模型在泛化能力上仍有不足,因此想实现规模化落地将依赖大量高质 量、细颗粒度的训练数据,因此这一领域市场潜力巨大。 当前,国内、外多家头部科技企业已启动具 身智能数据的规模采购,需求涵盖机器人在真实场景下的交互数据、构建仿真世界模型所需数据等。同 时,部分地方政府也在积极规划建设"具身智能训练场",旨在采集高质量数据,赋能科研与产业应用。 目前,公司已与多家机器人本体厂商展开合作,并与多家头部科技大厂及地方政府启动订单需求对接, 正在推进相关样例数据交付与训练场方案的设计与落地,为下一步具身智能数据业务的加速发展奠定坚 实基础。 ...
 机器人北京上学记
 经济观察报· 2025-09-21 12:57
 文章核心观点 - 具身智能的发展高度依赖高质量、多模态数据的采集与训练,这与依赖纯文本数据的大语言模型有本质区别 [1][5] - 数据已成为具身智能领域的核心生产要素和关键竞争壁垒,具有明确的经济价值,可被交易、获得补贴并成为企业融资的重要筹码 [5][9] - 北京正通过政策支持、场景开放和机制创新,系统性推动具身智能产业链发展,将整个城区打造为真实数据工厂 [5][13][17] - 行业在数据采集的技术路径上出现分化,主要围绕真机数据采集与合成数据两种路线展开,两者呈现互补趋势 [29][31]   具身智能数据采集的现状与规模 - 北京已形成多个数据采集中心,包括智源研究院、银河通用、北京人形机器人创新中心、星海图与千寻智能等,规模从三四十人到上百人不等 [4] - 千寻智能每天能采集上千条动作数据,按月形成可调用、可组合、可复用的能力库,训练效率相比过去提升近七成,新动作训练所需数据从六七百条降至不到百条 [7] - 北京人形机器人创新中心实现月均超过1万小时的动作数据采集,跻身全国采集中心第一梯队,重点关注数据质量与组织方式而非单纯总量 [8] - 星海图科技发布国内首个开放场景真机数据集Galaxea Open-World Dataset,总时长超过500小时,涵盖234种任务、1600余种物体与58类操作技能,发布一周后下载量突破8万 [18]   数据采集的场景与方法 - 数据采集场景覆盖家庭、商业与工业环境,包括1:1复刻的厨房、客厅、超市、加油站、工厂生产线等,任务涉及开冰箱、倒茶、补货、上下货等 [4][7][8] - 采集任务分为高复用性的通用动作场景和企业定制场景,后者如为家电企业采集冷柜操作流程可能需要上千小时 [8] - 基础动作由采集员完成,复杂操作由工程师佩戴VR设备远程控制,采用"自采数据、自控硬件、自测模型"的闭环体系 [6][7] - 北京亦庄的"具身智能社会实验计划"将实景场所扩展至上千个,数据池建设目标为PB(千亿字节)级,形成动态人机协同网络 [12][13][17]   政策支持与资本投入 - 北京亦庄出台专项政策,对数据采集标杆实训场给予每场所10万元奖励,对企业高质量数据集最高提供200万元资金支持,每年发放1亿元"数据券"用于补贴数据采购 [17] - 政策机制从过去补贴机器人本体转向以数据为激励对象,鼓励企业共建公共数据生态 [17] - 千寻智能自2024年初成立以来已获得近6亿元融资,投资方包括京东、小米系、宁德时代系与中东资本 [7] - 星海图完成近15亿元融资,获得美团、今日资本领投,北京机器人基金、亦庄国投跟投;银河通用在6月完成11亿元融资,创下国内具身智能赛道最大单笔融资纪录 [20][31]   数据采集的劳动力生态 - 数据采集依赖数以千计的具身智能训练师,岗位分为动作采集员、数据审核师和算法工程师三类,形成完整训练链 [22][25] - 一线采集员月薪5000-6000元,日均采集量50-200条,熟练者可达千条;审核师年薪可达8万元;核心训练师年薪15万-20万元;算法工程师月薪起薪2万元,最高可达10万元 [25] - 采集员招聘存在隐性门槛,偏好身高160-170厘米、动作协调性强、体型标准者,入职前需通过VR适应性测试,淘汰率超过50% [24] - 远程采集系统已上线,操作者可异地控制机器人完成采集任务,降低运营成本,目前已有100多台双臂机器人投入使用 [26]   技术路径的分化与探索 - 真机数据采集路线强调在真实世界中积累通用经验,如北京人形、星海图等企业通过真实场景采集构建数据配方 [8][18][29] - 合成数据路线以银河通用为代表,采用"虚实结合"范式,用10亿级合成数据进行端到端训练,仅用200条真实数据即让机器人学会抓取饮用水并泛化至不同品牌 [29][30] - 行业普遍采用仿真数据与真机数据9:1的混合比例,以平衡成本与产出,同时探索世界模型、人类在环训练等先进范式 [31] - 京东集团高级副总裁何晓冬指出,真实场景数据能影响更远的性能问题,具身智能企业应尽快让机器人参与实际工作以积累数据飞轮 [31]
 国家数据局局长刘烈宏调研具身智能产业高质量数据集建设
 快讯· 2025-06-20 22:34
 国家数据局局长调研具身智能产业 - 国家数据局局长刘烈宏调研睿尔曼智能科技公司和银河通用机器人公司 [1] - 参观睿尔曼人形机器人数据训练中心和银河通用实验室 [1] - 提出"人工智能+"到哪里高质量数据集就建设到哪里的发展理念 [1]   具身智能数据发展战略 - 数据被定位为具身智能发展的重要资源 [1] - 国家数据局将高质量数据集建设作为数据要素市场化新突破口 [1] - 重点推动仿真数据和真实数据的标准化、实用化、产品化 [1]   企业角色与行业方向 - 睿尔曼和银河通用被认定为具身智能数据领域先驱企业 [1] - 企业需积极挖掘数据价值并打开国内具身智能数据市场 [1] - 推动形成行业共识以释放数据要素价值 [1]
 具身智能数据需求驱动行业增长,计算机板块午后上扬,计算机ETF(512720)涨超1.4%
 每日经济新闻· 2025-06-05 13:57
 行业增长驱动因素   - 具身智能数据是推动计算机和软件开发行业技术突破的关键 分为真实数据和仿真数据两大类 [1]   - 真实数据通过机器人传感器与物理环境交互获取 成本高但真实性强 [1]   - 仿真数据借助计算机模拟生成 成本低效率高但真实性有限 [1]   - 行业当前面临高质量多样化数据集稀缺的挑战 需构建符合通用标准的数据集以支持模型泛化 [1]     行业技术发展现状   - 国内外已涌现AgiBot World Open X-Embodiment等开源数据集 涵盖多场景多任务 [1]   - 仿真数据技术路径包括合成视频+3D重建和端到端3D合成 [1]   - 群核科技 Hillbot等企业在仿真数据领域布局 [1]   - 数据采集标准的建立如《具身智能数据采集规范》将加速行业良性发展 [1]   - 未来训练将混合使用真实数据和仿真数据以平衡成本与效果 [1]     市场表现   - 计算机板块午后上扬 计算机ETF(512720)涨超1.4% [1]     指数与产品信息   - 计算机ETF(512720)跟踪CS计算机指数(930651) 覆盖计算机行业龙头企业 [2]   - CS计算机指数由中证指数编制 选取沪深市场计算机硬件软件及服务领域上市公司证券 [2]   - 该指数具有较强行业代表性和市场影响力 反映中国计算机行业整体表现 [2]   - 无股票账户投资者可关注国泰中证计算机主题ETF联接C(010210)和A(160224) [2]