数据采集
搜索文档
手机+机械手 人人都能“训练”机器人
新浪财经· 2026-01-13 15:26
行业核心趋势 - 具身智能行业面临高质量、多样化行为数据短缺的瓶颈 传统数据采集方式局限于实验室或“数据工厂”的模拟场景 无法覆盖真实世界复杂多变的环境和行为[2] - 行业借鉴自动驾驶发展路径 数据采集需从少量、受控的实验室环境转向真实场景中的规模化沉淀 以推动模型能力快速演进[2] - 让机器人在家庭、办公室等非受控真实场景中学习是行业关键挑战 需要记录人类世界千奇百怪的行为来训练大模型[2] 公司解决方案:RoboPocket方案 - 公司推出“口袋机采(RoboPocket)”方案 旨在实现轻量化、可控且高质量的真实场景数据采集[1] - 该方案核心硬件仅由智能手机和轻巧的二指机械手组成 借助手机摄像头、深度传感器和算力实时构建环境地图、指导动作并检测数据质量[2] - 方案支持“手的第一视角”和“第一人称视角” 通过多机快速对齐实现同一空间坐标 可突破双臂配对的技术难点[3] - 方案将数据采集门槛降至普通人可参与 用户在家进行叠毛巾、整理零食等日常动作即可转化为机器人可学习的操作信号[2] - 采集过程可实现即时反馈和“现场把关” 使后续数据处理从“灾难性清洗”转变为“有监督的筛选”[2] 公司战略与数据生态构建 - 公司计划通过众包模式激励普通人参与家庭数据采集 用户完成数据采集任务可获得相应回报 从而使数据更真实多样[4] - 公司认为不完美的操作数据同样具有价值 有助于机器人学会识别“不太对”的情况以适应现实世界[4] - RoboPocket是公司数据认知体系与模型训练管线的一部分 旨在将数据生产权交给社会大众 形成“人人可参与、数据有价值、模型能进化”的正向循环[4] - 公司此前已联合上海交通大学发布RH20T数据集 并于2025年推出CoMiner野外伴随采集系统[4] 潜在市场与应用前景 - 该方案有望将数据采集从有限的物理空间拓展至全社会[2] - 收纳师、咖啡师、药剂师、家庭主妇等不同职业和生活习惯者的行为 都将成为机器人学习的潜在教材[4]
2026年机器人数据战先一步打响!真机数据采集系统成具身智能的石油采集器?
机器人大讲堂· 2026-01-08 19:21
文章核心观点 - 数据正成为AI时代具身智能爆发的核心燃料,是决定机器人企业竞争力的关键变量 [1] - 高质量人形数据是具身智能的命门,是算法、算力、硬件、数据四大关键因子中唯一尚未突破的世界级难题 [3] - 随着需求的快速增长,具身智能数据领域的市场需求必然爆发,机器人行业即将迎来一场围绕数据采集、生成与应用的竞速 [1] 具身智能数据的重要性与趋势 - 数据是决定机器人企业竞争力的关键变量,曾被低估,现已成为世界级难题 [1] - 具身智能没有现成的互联网级数据池,每一条有效数据都需要通过真实交互或仿真模拟量身定制 [3] - 数据采集优先选择人形形态系统,因其形态、操作逻辑与人类场景高度适配,能更好解决数据真实感、通用性、泛化性三大核心诉求 [3] - 基于人形机器人采集的数据,随着人形机器人产业化落地,其数据可直接用于量产机型的模型迭代,形成数据采集-模型优化-产品落地-更多数据采集的正向循环 [5] - 业内预计,2026年头部算法公司的训练数据规模必然会突破百万小时 [1] 具身智能数据采集企业及方案 星海图 - 构建了从物理硬件到数据采集,再到数据管理、标注与处理的完整闭环平台 (EDP) [6] - 以R1 Lite通用双臂移动操作平台与R1 Pro高性能仿人机器人作为标准化的数据采集本体 [6] - 8月开源的开放世界数据集 (Galaxea Open-World Dataset) 在发布后两个月内下载量达40万次,成为全球下载量最高的具身智能真机数据集之一 [6] - 该数据集覆盖50多个真实场景,累计时长500小时,规模超10TB [6] 乐聚 - 人形机器人训练场核心模块分为训练层、持久存储层、数据层和设备层四个核心模块 [8] - 支持KUAVO 4pro全尺寸人形机器人和KUAVO LB轮臂式人形机器人两种异构机器人形态进行数据采集 [8] - 涵盖数据生产、模型训练、仿真测试与真机部署全流程工具链 [9] - 已在全国建立6大训练场,年产2000万条高质量真机数据 [9] - 开源了超60,000分钟真机数据以及800条灵巧操作数据集 [9] 鹿明机器人 - 推出FastUMI Pro多模态无本体数据采集软硬件系统,在精度、适应性、效率、成本与生态五大维度表现卓越 [11] - 首创“为模型成功率负责”的系统工程范式,从硬件设计源头保障数据质量 [11] - 集成高性能传感器,能稳定实现60Hz高频记录,配合独创的8道工业级数据质量评估体系,使数据有效率从行业普遍的70%提升至95%以上 [11] - 将单条数据采集时间从50秒缩短至10秒,效率提升5倍,同时将综合成本降至传统方法的五分之一 [11] - 系统实现了数据与机器人本体的解耦,可快速适配市场上数十种不同的机械臂和夹爪 [11] - 预期2026年实现超过100万小时的UMI数据采集产能 [12] 零次方 - 针对“数据模态缺失”问题,在Zerith-H1设计阶段即整合各种模态传感器,实现二维视觉、立体空间、关节信息、力反馈信息的“完整”模态信息采集 [14] - 全模态数据架构具备维度兼容性和价值持续性双重核心优势 [14] - 数据采集中心深度集成AI训练工具Swanlab,实现对模型训练的全过程记录、实时监控、数据可视化和批量实验分析 [15] 戴盟机器人 - 发布全球首款力/触觉反馈遥操作数据采集系统DM-EXton2 [17] - 致力于通过“3D”战略 (Device, Data, Deployment) 打造从感知到执行的完整闭环,以DaaS和VTLA模型驱动灵巧技能的规模化交付 [17] - 力/触觉反馈功能让机器人在遥操作过程中拥有“手感”,可实时反馈接触力、挤压等信息,提升精细任务的操作成功率与高质量数据采集效率 [18] 帕西尼 - 展示了全模态具身智能数据采集系统及由多维触觉传感器、六维力传感器、DexH13灵巧手、TORA系列人形机器人构成的全栈产品矩阵 [20] - 在天津落成了全球规模领先的具身智能数据采集与模型训练基地Super EID Factory [21] - 基于“人因”数据采集范式,构建专业化数据采集师团队,在涵盖工厂操作、家政服务等15+N类核心场景中采集全模态数据 [21] - 部署了150个标准化采集单元,具备年产近2亿条高质量、全模态、高可用性数据的生产能力,构建了亿级全模态数据集OmniSharing DB [21] - 项目投用半年以来,已支撑机器人完成电子制造、康养、零售等领域上万种精细操作 [21] 越疆 - 数据采集系统基于ATOM-M多形态机器人,形成基于实际应用反哺产品智能化的强化闭环 [23] - 包含沉浸式VR数据采集套件,利用动态跟踪算法结合5G超低时延通信,确保主从机器人跟踪延时<10ms [23] - X-Trainer训练平台创新性地将模仿学习神经网络、工业级高精度机械臂与高性能力反馈主手融为一体 [23] - 通过人类遥操作示范,将新场景、新任务的训练周期大幅缩短了70%,显著降至约2小时 [23] - 构建了高效学习、精准操作、极速部署的开放研究闭环,是AI大模型数据采集、AGI场景模拟与研究的理想交互平台 [25]
只用SO-100可以完成π0和π0.5的效果吗?
具身智能之心· 2025-12-11 17:33
文章核心观点 - 文章指出视觉语言动作模型在从理论到实际部署的落地过程中存在显著障碍 包括开源模型难以复现效果、训练与部署脱节、以及缺乏系统性的实战指导 [2][4][10] - 文章旨在推广一门名为《面向实战与求职的VLA小班课》的课程 该课程宣称是国内首个系统性解决VLA落地难题的实战课程 提供从硬件、数据采集、算法训练到真机部署的全栈教学 [10][12][15] VLA模型落地的主要挑战 - **开源模型复现困难**:GR00T、π0等模型虽已开源 但依据开源代码难以展示出良好的演示效果 [2] - **训练与部署脱节**:训练过程像炼丹 损失函数虽已降低 但部署到实体机器人进行推理时任务常失败 且原因难以定位 [2] - **世界模型应用模糊**:业界讨论世界模型已一年多 但学习者不清楚如何在训练和推理中实际应用 [2] - **全流程打通门槛高**:将数据、VLA模型、训练优化、部署整套流程打通对初学者非常困难 有人踩坑半年仍无法入门或取得好效果 [4] - **模型训练存在大量“技巧”**:特别是π0、π0.5、GR00T这类模型 在数据采集和模型训练环节存在许多未公开的细节与技巧 [4] VLA落地的关键模块与难点 - **数据采集**:主要方法包括基于模仿学习的遥操作、VR、全身动捕捉 在机械臂+VLA领域更多采用前两种 如何采集高质量数据及实现仿真到现实的转换是关键难点 [5][6] - **模型训练**:真机部署前需进行仿真调试 在真机数据不足时 使用Mujoco、Isaac Gym等框架进行仿真与Sim2Real尤为重要 [7] - **训练技巧至关重要**:如何微调模型、如何在小数据量下取得好结果是核心 许多学习者训练的模型存在机械臂运动不准、夹爪控制不好或运动误差大的问题 [7] - **算法选择影响效果**:ACT等算法相对简单易出效果 而π0和π0.5则非常难训练 对细节和技巧要求高 强化学习优化模型也极具挑战性 [7] - **模型部署与轻量化**:具身模型参数量大 即使是2B规模的模型 对边缘芯片部署挑战也很大 需通过量化、蒸馏等轻量化操作在保证性能的同时最小化参数量 [9] 课程解决方案与内容 - **课程定位**:该课程由具身智能之心平台联合业内VLA专家开发 是国内首个面向实战与求职的VLA小班课 旨在解决技术更新快、学习困难的问题 [10] - **课程内容全面**:课程涵盖机械臂硬件、数据采集、VLA算法、评测、仿真、主流VLA模型部署、VLA+世界模型、各类真机实验以及具身产业讲解 [12] - **课程硬件配套**:购买课程即赠送一套SO-100机械臂 包含示教臂和执行臂 [17] - **讲师背景**:讲师为某机器人公司VLA高级研究员 拥有5年以上机器人行业实战经验 精通具身智能全栈技术 并在顶级期刊发表学术论文10余篇 [20] 课程面向人群与要求 - **目标学员**:包括正在具身领域求职需要实战项目的同学、VLA领域需要进阶的学习者、从事具身智能研究的各学历层次学生、希望从传统CV、机器人或自动驾驶转行的人员 以及对领域感兴趣的其他人员 [22] - **硬件与基础要求**:建议推理使用RTX 3060及以上显卡 训练建议2张以上RTX 3090 Ti 也可自租云服务器 学员需具备一定的Python和PyTorch基础 [22] 课程学习收获与安排 - **学后收获**:学员将掌握真机调试与数据采集、各类VLA算法在真机上的部署、对VLA模型量化有深入了解、对具身产业落地有清晰认识 简历可获得足够项目支撑 学完可达1-2年以上算法工程师经验水平 [25] - **开课时间**:课程于2025年12月30日正式开课 共分九章 持续至2026年2月25日 [23][26]
宇树科技 G1-D,开启人形机器人数采训练全新时代!机器人ETF(562500) 震荡企稳,持仓结构偏强支撑盘面韧性
每日经济新闻· 2025-11-13 14:27
机器人ETF市场表现 - 机器人ETF(562500)最新价0.972元,小幅上涨0.31% [1] - 日内走势呈现冲高回落后的弱势整理格局,分时价格运行在分时均线附近 [1] - 持仓股结构上,73只成分股中上涨43只、下跌30只,涨幅端由宏英智能、海目星、景业智能等高景气个股领衔,部分强势股涨幅超过3% [1] - 盘中交投保持活跃度,成交延续平稳释放,规模与份额维持高位 [1] 人形机器人技术进展 - 宇树科技上线人形机器人数采训练全栈解决方案,基于轮式机器人G1-D,由高性能人形机器人本体、数据采集工具和模型训练及推理工具组成 [2] - G1-D机器人身高范围约1260-1680mm,头部配备高清双目相机,手部配备高清相机 [2] - G1-D分为通用版和旗舰版,旗舰版可选配移动底盘,移动速度≤1.5m/s,通用版和旗舰版分别有17和19个整机自由度 [2] - 单臂自由度(不含末端)为7个,单臂最大负载约为3kg,采用轮式与升降相结合的移动升降设计,垂直作业空间为0-2m [2] 数据采集工厂行业生态 - 2025年以来各地纷纷投建数据采集工厂,智元等占据主要位置,地方性政府与整机厂合资成立数采工厂的案例持续增多 [3] - 合作模式多为政府招标采购机器人本体并提供场地支持,企业投标供给数采本体并提供持续性技术支持 [3] - 具备百台级别的数采工厂年产有效数据规模可达数万小时,具备千万元级别数据销售收入的潜能 [3] - 暂不具备本体量产能力的大模型企业是当下具身数据的主要需求方,群核科技、帕西尼感知等已在国内外主流数据交易所上架数据产品 [3] 行业成本优势与发展预测 - 国内数采人员用工成本显著低于北美,成为国内规模化发展数据采集的优势 [3] - 各地数采工厂有望发挥桥头堡作用,成为整机厂遍布全国的潜在经销网络及人才吸引和品牌建设的高地 [3] - 预计2025年国内产出70+万小时真实数据,到2028年国内累计数采用本体数量将接近8000台 [3] - 机器人ETF(562500)是全市场唯一规模超两百亿的机器人主题ETF,成分股覆盖人形机器人、工业机器人、服务机器人等多个细分领域 [3]
特斯拉人形机器人,新进展曝光
财联社· 2025-11-03 13:09
特斯拉Optimus机器人数据采集方法 - 公司采用一支超过100人的数据采集团队,通过摄像头直接采集人类动作数据,而非使用动作捕捉服或手动控制[2][3] - 数据采集员每班工作8小时,需重复数百次如拿杯子、擦桌子等动作,并收集至少4小时的可用视频素材[2] - 采集设备包括环境摄像头以及员工头盔和背包上搭载的约5台摄像头,设备重量给员工带来背部和颈部受伤等身体负担[2][3] 特斯拉对人形机器人的战略定位 - 公司目标为实现年产100万台Optimus机器人[3] - 公司预计未来人形机器人业务将占据其总价值的80%左右[3] 机器人行业数据采集的趋势与市场 - 真实数据被视为训练效果最好的“黄金数据”,但成本高且格式不统一;仿真数据可大规模生成且成本低,但模型适应性差[4] - “虚实结合”是行业主流数据采集方案,通过融合高仿真数据与真实数据构建数据底座,以提升机器人智能泛化能力[4] - 数据采集系统市场规模预计从2025年的超过24亿美元增长至2035年的39.8亿美元,2026-2035年复合年增长率约5.2%[4] 机器人训练的AI化发展趋势 - 公司宣布在自研世界模型中训练Optimus机器人[5] - 行业目前采用世界模型、遥控操作等方法均存在局限性,具身智能的学习训练方法仍有待探索[5]
速递|对标Scale AI,华人数据标注Datacurve完成1500万美元融资,已发放超百万美元赏金
Z Potentials· 2025-10-13 12:55
行业背景与竞争格局 - AI行业竞争焦点转向高质量数据,催生了Mercor、Surge等企业,其中Scale AI尤为引人注目[1] - 随着Scale AI创始人转投Meta,投资者开始关注并资助拥有创新训练数据采集策略的公司[2] - 模型训练数据需求日益复杂,从早期简单数据集发展为需要复杂强化学习环境,推动数据需求在数量和质量上呈指数级增长[5][6] 公司融资情况 - Datacurve完成1500万美元A轮融资,由Mark Goldberg领投的Chemistry基金主导,DeepMind、Vercel、Anthropic和OpenAI员工跟投[2] - A轮融资前公司曾获得270万美元种子轮融资,前Coinbase首席技术官Balaji Srinivasan参与投资[3] 商业模式与核心优势 - 公司采用"赏金猎人"机制吸引技术精湛的软件工程师完成最难获取的数据集,已发放超100万美元赏金[4] - 核心优势在于提供优质用户体验,将平台视为消费级产品而非数据标注流水线,注重优化平台以吸引并留住目标人群[4][5] - 对于软件开发等高价值服务,数据工作的报酬远低于传统就业,因此用户体验成为最大驱动力而非金钱回报[4] 市场定位与发展战略 - 公司目前专注于软件工程领域,但其模式可适用于金融、营销和医疗等其他领域[7] - 正在构建面向训练后数据采集的基础设施,旨在吸引并留住各领域的顶尖人才[7] - 随着环境复杂度提升,数据需求增长趋势可能为Datacurve等高质量数据采集公司创造竞争优势[6]
不同业务适配方案:国外独享专线 IP 在跨境办公、数据采集、海外测试中的应用
搜狐财经· 2025-10-12 00:55
跨境办公 - 核心需求为保障远程协作、文件传输和视频会议的稳定性与安全性 [1] - 亚洲市场可选择香港节点(中国大陆访问延迟<50ms)或新加坡节点(延迟低至30ms)[2] - 欧美市场通过美国多节点部署结合SD-WAN技术,可降低30%网络成本 [2] - 轻量级业务(如基础远程办公)建议配置3-10Mbps独享带宽 [2] - 中大型业务(如多平台电商运营)建议配置50-200Mbps独享带宽以支持高并发流量 [3] - 采用IPsec、SSL/TLS等端到端加密协议防止数据泄露,金融行业需选择通过PCI DSS认证的服务商 [3] - 优先选择通过GDPR、ISO 27001认证的服务商,确保数据存储本地化以规避法律风险 [4] 数据采集 - 核心需求是规避反爬机制并成功获取目标数据 [7] - 优先选择住宅IP而非数据中心IP,因为住宅IP匿名性更高,复用率更低 [8] - 支持动态IP轮换,可按时间(如每小时)或按任务手动切换IP,避免触发反爬机制 [9] - 根据采集目标定制地域IP,例如采集美国数据选用美国本土IP [9] - 在目标市场部署2-3个节点,通过BGP Anycast自动切换路径以降低延迟 [10] - 提供专属带宽保障,支持高速批量采集大体积数据(如视频字幕、高清图片)[10] - 通过API接口实现IP自动切换,并结合监控脚本实时监测带宽使用率、延迟等指标,超阈值时自动扩容 [11] 海外测试 - 核心需求是模拟目标市场环境并验证业务合规性 [14] - 使用目标市场IP模拟真实用户环境,并确保IP活跃时间符合当地用户作息(如GMT时区晚7-11点高峰)以提升自然流量转化率 [14] - 选择通过GDPR、CCPA认证的服务商,确保数据存储本地化以满足数据主权合规要求 [15] - 提供针对亚马逊、TikTok等平台的反封禁技术方案,如IP轮换策略和设备参数模拟,以降低封号风险 [15] - 测试环境需支持高并发≥5000线程,带宽≥1Gbps,以满足大规模压力测试需求 [15] - 通过监控工具实时检测响应速度、丢包率等指标,异常时触发告警以保障测试环境稳定性 [16]
成本相差200倍!遥操作、仿真、UMI、视频学习,谁才是具身智能数据领跑者?
机器人大讲堂· 2025-10-03 12:04
文章核心观点 - 数据采集是实现具身智能从L1特定任务向L2组合任务乃至更高阶通用能力迈进必须突破的核心环节[1] - 高质量、多模态的物理交互数据是构建机器人“举一反三”常识理解能力的基础[4] - 数据采集的“量”与“质”直接决定预训练效果,是技术进阶的核心,行业对高效、高质量方案需求迫切[3][6] - 未来趋势是多方案融合,以实现成本、精度、规模三者的平衡,数据生态成为竞争关键[28] 数据采集的重要性与挑战 - 具身智能需要物理世界绝对坐标系下的精确测量数据,获取难度、成本与标注周期远超传统AI需求[3] - 要达到人眼级三维感知及上千类物体理解,需构建10亿+量级的数据集[3] - L1级模型需1万小时+数据量支撑训练,且规模定律仍未见顶,数据规模扩大能持续提升模型性能[6] - 数据必须覆盖多样化场景(家庭、实验室、生产线)才能使模型具备泛化能力,摆脱场景依赖[6] - 数据特殊性高,需视觉、惯性、触觉、力反馈等多模态信号并在绝对坐标系下精确对齐[6] 四大核心数据采集方案 遥操作方案 - 通过人类直接操控机器人完成任务,数据质量最高,可实现人机动作精准映射[8] - 采用VR遥操+动捕手套组合,长距离移动中位置漂移极低,为复杂协调动作提供可靠数据[8] - 已形成规模化落地,例如深圳某企业在天津建12000平方米数据工厂,覆盖15大领域,部署150个采集单元[10] - 高成本是最大制约,一套完整设备超20万元,单小时数据采集成本可能突破万元[12] - 设备重量与易用性、实时性与精度平衡是待解决问题[13] 仿真方案 - 通过虚拟环境生成数据,最大优势是高效低成本,无需物理硬件,可快速复制标准化场景[14] - 致命痛点是“数据分布偏移”,虚拟环境无法完全模拟真实物理规律,导致模型在真实场景中水土不服[16] - 目前更多用于“预训练初始化”,先用仿真数据掌握基础动作,再用真实数据微调以降低成本[18] - 实现高精度模型需物理引擎技术突破,如更精准的材质模拟和环境物理参数还原[18] UMI多模态传感器融合方案 - 硬件配置简洁低成本,整体成本仅万元级别,远低于遥操作的20万+投入[19] - 核心价值是解决“鸡与蛋”悖论,不依赖昂贵机器人本体却能采集高精度动作数据[21] - 技术关键是视觉-惯性融合,支持触觉模块扩展,形成多模态数据采集能力[21] - 拥有开源生态,降低技术壁垒,中小企可通过开源方案构建高质量数据集[21] - 局限性在于全身动作捕捉能力不足,主要聚焦机械臂末端操作[21] 视频学习方案 - 通过录制员工执行任务视频提取动作信息,为数据采集提供低成本规模化新思路[22] - 成本极低,仅需普通摄像头,枢途科技自研算法使成本降至行业平均水平的千分之五,较遥操作降低200倍[22][24] - 效率高,可同时录制多名员工操作视频,快速扩大数据规模,场景多样性强[24] - 面临三大挑战:缺乏交互体验(触觉、力反馈)、数据标注难度大、对计算资源处理要求高[27] - 被视为未来重要方向,若解决无交互信息与标注成本问题,将改变数据采集格局[27] 行业发展趋势 - 未来趋势是多方案融合,通过优势互补实现成本、精度、规模三者平衡[28] - 终极目标是实现“自主数据闭环”,机器人自主完成任务、采集数据、优化模型[28] - 需突破三大技术瓶颈:高效多模态传感器融合、智能自动标注、精准场景适配方法[28] - 数据采集的关键在于“越精准、越多样、越低成本越好”,找到三者平衡的企业将在竞争中占据先机[28]
王兴兴回应“限制机器人爆发的核心问题”:数据采集处在模糊阶段
贝壳财经· 2025-09-11 13:33
行业观点 - 机器人产业发展的核心问题涉及数据和模型架构两方面 均非常重要[1] - 当前行业核心问题包括难以判断优质数据的标准 以及优质数据采集方法和规模不明确[1] - 行业应尽可能提高对数据的利用率以推动技术发展[1] 技术挑战 - 数据采集过程中存在模糊阶段 包括采集标准和规模确定[1] - 模型架构与数据质量共同影响机器人产业发展水平[1]
自动驾驶转具身智能有哪些切入点?
自动驾驶之心· 2025-08-25 07:32
算法技术延续性 - 具身智能领域基本延续机器人和自动驾驶的算法 包括训练与微调方式以及大模型技术[1] - 具体任务存在差异 主要体现在数据采集方式以及重执行硬件与结构方面[1] 技术研究方向 - 主要技术方向涵盖VLA(视觉语言行动) VLN(视觉语言导航)和Diffusion Policy(扩散策略)[1] - 涉及强化学习 机械臂抓取 位姿估计和机器人仿真技术[1] - 包含多模态大模型 芯片部署 sim2real(仿真到现实)以及机器人硬件结构研究[1] 行业生态建设 - 建立具身智能全栈学习社区 持续分享算法与软硬件方案[1] - 日常更新行业动态与招聘信息 形成技术交流与人才发展平台[1]