Workflow
Gen DAS数据采集设备
icon
搜索文档
“以人为中心”的具身数采逐渐成为首选,产业玩家格局初现~
具身智能之心· 2025-12-29 08:04
文章核心观点 - 当前机器人算法在真实场景中应用困难的核心原因是模型泛化能力不足,而泛化能力依赖于大规模高质量数据,因此如何低成本、规模化地获取高质量数据成为行业关键问题 [2] - 行业为解决数据问题已演变出四条主要技术路线,即在数据质量与获取成本间寻求平衡 [3] - 在多种方案中,“以人为中心”的数据采集技术路线,特别是基于UMI(通用操作接口)理念的便携式设备方案,因其在成本、规模和跨场景能力上的综合优势,正成为行业主流方向 [11][13] - 围绕“以人为中心”的数据范式,已初步形成产业玩家格局,多家公司推出了各具特色的便携式数据采集终端并布局规模化数据生产 [14][26] 行业现状与核心挑战 - 机器人算法研究活跃但真实场景应用少,模型泛化性不足是根本原因,场景稍变即性能下降 [2] - 高质量数据采集面临成本高、周期长、难以规模化、定制化属性高等挑战 [2] 主流数据获取方案 - 行业形成四种核心具身数据获取方案:UMI数据、遥控真机数据、仿真数据与人类视频数据 [3] - **UMI数据**:通过手持夹爪与腕部相机采集,实现不同机器人平台的数据互通与高效采集,为模型通用化训练提供基础 [4] - **遥控真机数据**:获取成本极高,但因真实环境不可替代、数据价值密度高(包含完整任务闭环)、是商业化落地必经之路,仍被视为核心数据类型 [5][12] - **仿真数据**:主流有纯仿真和real2sim2real方案,后者借助真实数据生成更逼真仿真数据,但存在真实性问题,真机泛化是挑战 [6] - **人类视频数据**:规模大、成本低、场景覆盖广,但无法直接取得很好泛化效果,适合预训练阶段 [7] 数据方案的关键评估维度 - **规模化**:高质量和不同场景的数据越多,真实场景效果越好 [8] - **跨本体**:能够跨本体使用的数据发挥空间更大,未来是本体形态百花齐放的时代 [9] - **成本**:低成本是保证规模化的必经之路 [10] “以人为中心”数据方案的优势 - **通用性强,打破平台壁垒**:通过标准化接口实现“无本体依赖”的数据采集,提升数据复用价值 [11] - **数据质量稳定,标注精度高**:内置标准化标注模块,采集过程同步完成精准标注,基于真实物理交互,真实性高 [11] - **采集效率高,成本可控**:实现自动化采集与传输,无需为不同平台单独开发系统,降低前期投入成本 [11] - **便携式设备**:允许在真实场景中连续记录人类完成复杂任务的过程,产生“连贯行为链”数据,并能直接采集海量多样化的人类操作数据 [13] 产业玩家格局与产品 - 行业内“以人为中心”相关玩家主要分为两类:拥有自家机器人本体+数据采集终端产品的公司,以及更聚焦数据领域、提供多模态数采终端和一站式数据服务的公司 [14] - 具身智能领域正出现类似智驾行业的生态圈,智驾领域公司(如Momenta、地平线)近1年来有多位高管和技术核心人员参与创业 [15] - **鹿明机器人**:发布FastUMI Pro多模态无本体数据采集软硬件系统,采用轻量化手持式夹爪方案,整体重量仅600g,负载能力达2kg,并已搭建3个数采厂提供数据服务 [16] - **简智**:发布Gen DAS数据采集设备,轻量化、无线化、便携化,其具身智能数据产线通过走进数千个家庭模式批量制造高质量数据 [18][20] - **它石智航**:发布轻便、模态齐全、可穿戴的具身数据采集系统SenseHub,将视觉、触觉与手部动作数据深度融合,持续记录真实高质量操作行为 [21] - **数元时代**:推出MeData Link系列多模态数据采集终端产品,包括手持式夹爪数采终端,无需定位基站、无线、轻量便携,搭建了规模化真实场景数据采集产线,目标实现日产千小时以上高质量数据,并同步搭建超8000平方米的数采厂 [23][25] 行业发展趋势与竞争关键 - 当前具身智能领域现状是重数据和本体,在本体质量提升的同时,谁掌握更多数据,谁就拥有更多市场话语权 [26] - 对于具身公司而言,能够低成本构建丰富的数据库至关重要 [26]
简智机器人完成第三轮融资 总额超2亿元,加速以数据闭环构建具身智能产业基石 | 融资速递
钛媒体APP· 2025-12-18 12:49
公司融资与市场定位 - 简智机器人在成立4个月内快速完成第三轮融资,融资总额超过2亿元人民币,成为具身智能数据基建细分赛道融资进展最快的企业[2] - 融资历程包括:种子轮由BV百度风投领投,Momenta、九识、星海图跟投;种子+轮由速腾聚创领投,BV百度风投跟投;天使轮由顺为资本领投,初心资本、BV百度风投超额跟投[3] - 此次融资获得产业资本高度认可,印证了市场对具身智能数据基建赛道及公司核心竞争力的看好[2] 公司理念与核心战略 - 公司秉持“具身智能源于人、回归人”的理念,专注于将AI落地物理世界[2] - 采用全栈自研的“产品+产线”双轨战略,构建“人类技能数字化-云端AI数据治理-机器人应用”全链路闭环解决方案[2] - 核心团队由“模型+智驾数据工程团队”组成[2] - 公司精准把握具身智能“数据为王”的核心逻辑,侧重数据全链路价值挖掘,其核心认知是“数据治理、产线设计比单纯做硬件更重要”[3][14] 产品与技术进展 - 公司在4个月内完成了采集设备、数据链路、数据平台与算法等全链路产品交付,展现出远超行业平均水平的高效执行力[4] - 量产了多款Gen DAS数据采集设备,具备轻量化、无线化、便携化特点,大幅提升了采集泛化能力[4] - 采集数据质量行业领先,轨迹精度小于1厘米,多设备同步延迟小于1毫秒[4] - 通过Gen Matrix平台处理,可完成轨迹还原、深度信息输出、环境重建[4] - 实现了无本体、双设备的协同,设备坐标系与动作轨迹同步对齐[4] - 建立了采集-部署的自闭环,通过自训模型完成技能的落地与验证[4] 核心产品体系:Gen Data 1+x 与 Gen ADP - “1”为Gen Matrix数据智能平台中枢,注重数据提纯与智能转化,可按需完成数据清洗、标注、环境重建及模型评测,自动生成二次数据需求,形成迭代核心引擎[7] - “X”涵盖Gen Das无感可穿戴采集设备与Gen Controller技能终端[7] - Gen Das以“可穿戴、无本体数据采集”为核心,解决传统数据采集“难部署、质量低、效率差”的痛点,其核心优势包括:重量仅470克,开机即用;覆盖图像、触觉、关节角度等多模态数据;拥有超3万触觉检测点,支持毫秒级、亚毫米级追踪,真值误差小于1厘米;多设备时间误差小于1毫秒;数据可压缩至原大小2%,实现分钟级上传[7][8] - Gen Controller与Gen Das同构设计,可实现技能训练后快速落地,完成“采集-应用”硬件闭环[7] - Gen ADP是行业首个具身智能数据产线,作为千万级人员技能数据化的超级系统,已经完成建设并走进数千个家庭模式,批量制造高质量数据[7] 数据能力与运营成果 - 公司完成了规模化、众包真实场景采集,累计完成超百万小时、覆盖超过500种技能的数据资产积累[3] - 数据采集已覆盖超过1000个家庭,规模化部署初步完成[10] - 核心创新在于将采集进入真正的家庭、工厂、实验室等场景,实现低成本、高效、高保真的自动闭环数据生产,采集后2小时内即可交付高质量加工数据,模式具备独家性优势[10] - Gen Matrix数据治理平台建立了自动化、标准化、闭环式的系统,以提升数据价值[11] - 具体数据治理能力包括:高精准的轨迹还原与清洗(轨迹真值误差小于1厘米);智能化标注与自适应切片;在端侧部署“轻量级、高压缩”能力,实现高鲜度、高保真、低成本的数据处理;每日数据时长增长超过1万小时,高质量数据产出量超过10万 clips;累计在数万个真实场景中拥有超过1000种技能数据[13] 产业评价与合作伙伴认可 - 投资方普遍认为,公司聚焦的数据基建领域是具身智能规模化突破的关键[15] - Momenta CEO曹旭东看好公司以数据为切入口,建设具身智能的飞轮效应,并为团队强大的工程能力和战斗精神所认可[15] - 九识智能CEO孔旗认为公司为行业提供了数据问题解决新思路,并期待在场景协同、海外拓展等方面深化合作[15] - 速腾聚创CEO邱纯潮将公司誉为具身智能领域的“NVIDIA”,高度认同其以AI定义硬件的发展路径,并认为其解决了具身行业的实际需求[16] - 星海图CEO高继扬视公司为重要的生态战略伙伴,其多模态数据采集技术为星海图的基座模型提供了关键支持[16] - BV百度风投投资副总裁崔轲迪认为团队勾勒出了一家优秀数据智能公司应有的模样,并期待共同推动公司成长为顶级领军企业[17] - 顺为资本执行董事耿益璇认为公司是具身智能数据基建赛道的破局者,精准破解行业痛点,团队用四个月完成软硬件交付与三轮融资的表现远超行业常态[17] - 初心资本合伙人Max认为团队展现了突出的技术前瞻性与战略定力,先于行业共识精准卡位,并看好公司成长为具身智能时代不可或缺的中立数据基础设施[17] 未来发展规划 - 下一阶段,公司将持续优化Gen Data 1+X与Gen ADP产线能力,重点提升真实环境下数据采集的稳定性、一致性与可复用性,进一步强化从采集、处理到模型训练的工程闭环,并与全球头部企业协同迭代数据采集策略与工具链设计[20] - 公司将完善Gen Matrix数据引擎能力,逐步构建面向多任务、多形态具身智能系统的通用数据底座,使数据生产、模型更新与系统优化形成可持续迭代的反馈回路[20] - 通过长期沉淀高质量真实世界数据,公司旨在为具身智能在复杂物理环境中的持续训练与应用提供稳定、可扩展的数据基础[20]