Workflow
数据平权
icon
搜索文档
对话穹彻、鹿明:UMI登场,具身智能数据的平权时刻
36氪· 2026-01-23 15:43
文章核心观点 - 通用操作接口(UMI)作为一种低成本、高效率、可规模化的真实数据采集新范式,正在缓解具身智能领域的“数据荒”问题,并推动行业走向“数据平权”[3][4][5] - UMI通过硬件成本大幅降低和数据与本体解耦,使大规模、高质量、多样化的真实数据采集成为可能,不再是头部企业的专属优势[10][12][14] - UMI与真机遥操作、仿真数据等并非替代关系,而是长期竞合、多源并存的互补关系,共同构成未来具身智能的数据体系[27][28][29] UMI技术定义与特点 - UMI是一种通过手持夹爪、摄像头和位姿估计算法,将人类手势动作直接转化为机器人可学习轨迹的低成本数据采集方案[3] - 其数据形态介于机器人数据与人类数据之间,是一种中间态,让人类代替机器人本体在现实环境中流动操作以产生数据[9] - UMI的核心特点之一是“无本体”,旨在让数据采集走出实验室,进入更丰富的真实物理世界场景[25] UMI带来的成本与效率优势 - 以鹿明机器人的FastUMI Pro为例,相比传统遥操作方案,人力成本降至1/5,硬件成本降至1/200,采集效率提升3倍[12] - 穹彻智能的RoboPocket方案直接采用iPhone作为核心硬件,最大化复用现有智能终端,进一步压缩前期研发与部署成本[14] - 成本的大幅下降使得第二、第三梯队企业首次具备了参与数据竞争的可能,打破了“最多本体,谁就能暴力生产数据”的格局[10][14] UMI对数据规模与多样性的影响 - 鹿明机器人计划在2026年建立起100万小时规模的具身真机数据产能[4] - UMI使数据采集能以分布式、更贴近日常生活的方式进行,有助于获得更丰富的场景数据,解决“分布偏移”问题[23][25] - 穹彻智能正小规模测试众包数采模式,未来可能面向普通用户推出百元级硬件套装,在家庭等场景采集多样化数据[19][21] 数据质量治理与模型训练闭环 - 早期UMI方案采集的数据可用率可能只有10%,数据质量是关键挑战[16] - 行业已认识到,围绕UMI的核心议题是数据治理,确保轨迹精度、时序一致性、画面质量等多维度达标[18] - 鹿明机器人通过建立8道工序的工业级数据质量评估体系及实时校验,将数据有效率提升至95%以上[19] - 穹彻智能通过“数据导师App”进行任务指导、实时提醒和质量打分,从源头控制质量[19] - 2025年底,海外厂商如Generalist和Sunday已利用UMI数据成功训练出模型,初步证明了该路径的可行性[16] UMI与现有数据采集路径的关系 - UMI的出现并非对真机遥操作的替代,两者是长期的竞合关系[27][28] - 在危险化工、重载搬运等特定场景,遥操作机器人仍具备不可替代性;在某些高负载任务中,遥操作反而更省力[27] - 中短期内,UMI更适合与现有数据采集工厂结合,利用其管理经验,推动工厂升级并释放更大数据产能[28] - 未来的具身智能数据体系将是多源并存、按任务分层、按阶段取舍的[29]
具身智能的“造梦工厂”开源:一场AI定义机器人的数据平权革命
机器人大讲堂· 2026-01-20 17:11
文章核心观点 - 跨维智能于2026年初开源了全球首个完全使用合成数据训练并能在真实世界零样本部署的具身智能工具链EmbodiChain,这标志着具身智能领域迎来了类似大语言模型ImageNet时刻的范式转变,有望开启一个数据平权的时代 [1][2][3] 具身智能的“ImageNet时刻” - 传统机器人训练面临数据稀缺、成本高昂、难以泛化的三重困境,真实数据采集耗时耗力且有安全风险,仿真数据存在“虚实鸿沟”,不同机构数据格式不一形成“数据孤岛” [4] - EmbodiChain构建了“造梦-学习-验证”的完整闭环,无需原始真机 [5] - 第一阶段(Real2Sim)支持两种数据生成路径:基于语言描述的DexGen可自动生成仿真场景,基于动作轨迹的DexDyna可将真实操作视频转化为可仿真的动作序列 [6][7] - 第二阶段(Sim Data Scaling)基于少量“种子”场景,通过生成式仿真技术实现百万级数据扩增,在任务、资产、场景、技能四个维度进行智能扩展 [9] - 第三阶段(Sim2Real)训练完成的模型可直接部署到真实机器人,实现零样本迁移,通过大规模域随机化策略使模型聚焦任务本质特征 [9] - 该范式使机器人可以完全依靠100%合成数据习得技能并在真实世界完美执行,打破了仿真数据必须与真实数据混合使用的行业潜规则 [9] 世界模型之争:从“视频生成”到“物理仿真” - 2025年,“世界模型”成为具身智能领域热门概念,技术路径出现分野 [10] - 一类是基于视频生成的世界模型(如Sora后续发展),能生成逼真视频但缺乏三维结构和物理规律支撑 [10] - 另一类是基于3DGS(三维高斯泼溅)表征的技术(如GSM),适合娱乐应用但难以实现精准的物理属性仿真 [11] - 跨维智能走第三条路:基于生成式仿真和GS-World物理模型生成的世界模型,不仅生成视觉场景,更构建严格符合牛顿力学定律的虚拟物理世界 [11] - GS-World被称为“世界模型2.0”,物体具有基于建模而来、可计算、可优化的质量、摩擦力、碰撞、形变等物理属性 [11] - 基于物理仿真的世界模型能直接输出可在工厂、仓库、家庭中实际工作的机器人策略,而视频生成的世界模型难以转化为真实技能 [12] 数据平权:打破巨头垄断的“武器” - 当前高质量机器人数据被少数巨头垄断,构建了难以逾越的数据壁垒,初创公司和小型研究机构几乎无法参与竞争 [14] - 如果模型训练仍需1%真实数据,则每个新场景都需搭建真实环境采集数据,无法解决高效低成本商业落地的核心问题 [14] - EmbodiChain的开源是一场数据平权运动,将曾经只有巨头才能负担的数据生成能力免费提供给整个行业 [14] - 这种平权可能重塑行业生态,大公司难以凭借数据积累建立护城河,小团队有机会在特定领域突破,学术界与工业界的差距可能迅速缩小 [14] - 投资于大规模真机数据采集的路线,可能在新范式面前失去优势 [14] Efficiency Law:机器人领域的新“摩尔定律” - 大语言模型的Scaling Law(规模定律)在机器人领域遭遇挑战,因为物理交互数据获取成本极高,难以实现互联网规模的数据积累 [17] - 跨维智能提出了适用于机器人的Efficiency Law(效率定律),指出在有限时间内,决定具身模型性能上限的关键变量是高质量数据的生成速率 [18] - EmbodiChain是验证Efficiency Law的首个高数据生成速率引擎,通过GPU并行与Real2Sim技术最大化数据生成效率,将行业从Data-Driven(数据驱动)推向Engine-Driven(引擎驱动)的新范式 [20] - 这种转变的意义不亚于从手工制造到自动化生产的工业革命 [20] - EmbodiChain是GS-World(生成式仿真世界模型)的底座,GS-World的终极形态是机器人的完整演化场,机器人的形态、感知系统、能源系统都可以在物理引擎中协同演化 [21] - 预测2026年世界模型,尤其是基于三维物理的世界模型会非常火爆 [22] 商业落地:从百台出货到行业赋能 - 跨维智能的人形机器人已实现批量出货,主要应用于基于上肢操作的商业服务吧台场景 [24] - 2025年8月开始批量出货,如今超过百台,营收近亿元 [24] - 公司不仅销售机器人本体,更提供从数据生成到模型训练的工具链,本质是卖给客户一个能够产生模型的能力 [24] - EmbodiChain提供的是一种元能力,即生成数据、训练模型、部署应用的全栈能力,客户可用其解决特定问题 [24] - 该模式灵活且具扩展性,可通过调整优化目标满足工业场景的高成功率、商业场景的低成本、服务场景的良好人机交互等不同需求 [25] - 开源EmbodiChain是生态建设的开始,旨在通过构建标准化、共享的基础设施来迎接具身智能的“ImageNet时刻” [26]
深度|Vibe Data Analysis新范式,TabTab.ai全链路Data Agent让数据搜集到深度分析一步到位
Z Potentials· 2025-08-14 11:33
引言 - 全球数据总量预计2025年突破180ZB,其中80%为非结构化内容,传统数据分析在多模态信息处理和技术壁垒方面存在不足 [2] - 传统数据分析体系存在数据链路长、门槛高、决策滞后、实时性不足等结构性痛点 [2] TabTab.ai切入Data Agent赛道 - 公司选择从Data Agent切入,构建全栈自动化Multi-Agent系统,覆盖数据获取、准备、建模、洞察、可视化全链路 [3] - 创始人黄启功是连续创业者,曾创立时速云并被收购,拥有云原生领域丰富经验 [4] - 创始人认为"Data Agent is the biggest chance for AI startup right now",生成式AI市场比云原生大10倍以上 [5] - 团队早期技术来自大模型开源项目KubeAGI核心贡献者,该项目比字节跳动AIBrix早一年半 [7] 产品定位与竞争优势 - 产品定位为全链路Data Agent,打造Vibe Data Analysis新范式 [5] - 三大竞争壁垒:1)多源数据支持(公域+私域+垂直领域);2)结构化数据语义层构建(100%准确);3)Multi-Agent智能架构 [11][12][13] - 目标用户为超级个体、知识工作者和SMB客户,采用积分包充值按资源消耗计费 [14] - 典型案例包括多源数据整合、数据清洗处理、对话式数据库分析、分钟级可视化、深度财务报告等 [15][17][18][19][21] 市场前景与战略 - 预计2025年全球数据180ZB,80%非结构化,传统模式抑制数据价值 [9] - 打造"生成-分发-消费"数据平台,降低创作门槛,实现数据平权 [23][25] - 先本土化后全球化战略,7个月开发国内版,3个月内推出海外版 [26] - 已完成百万美金级种子轮融资,正在招聘核心团队成员 [28] 产品愿景 - 重构人机交互模式,实现"语义即服务、对话即分析、洞察即行动" [5] - 让数据分析从"工具插件"升级为"决策伙伴",加速数据平权 [11] - 愿景是"人人皆数据分析师",让数据成为驱动业务增长的燃料 [25]
专访北京交通大学特聘教授张向宏:未来国家数据基础设施技术路线一定会收敛成一条,核心是将供数、用数和服务主体放进同一个空间
每日经济新闻· 2025-05-12 14:37
数据基础设施技术路线 - 核心目标是解决数据"供不出、流不动、用不好"问题,实现数据"供得出、流得动、用得好、保安全" [3] - 衡量成效的两大指标:海量数据流通规模(如滴滴、美团等平台亿级用户数据)及流通过程安全性 [4][5] - 关键技术包括区块链、隐私计算、数联网、数据元件、数场、可信数据空间六种路线,需兼顾效率与安全 [5] 可信数据空间发展 - 国家政策专项支持可信数据空间,计划2028年建成100个以上,社会探索活跃度高于其他技术路线 [9] - 未来技术路线将收敛为统一平台/空间/场,核心需整合供数主体、用数主体和服务主体 [10] - 构建技术可能涉及隐私计算、区块链等,但名称不重要,关键在于实现高效安全的数据流通 [10] 行业应用与数据平权 - 各行业数字化转型需求趋同,国家需填平"数据鸿沟",优先推动工业制造、现代农业数据应用 [12] - 数据基础设施将支撑人工智能发展,解决数据质量与规模问题,减少大模型幻觉等缺陷 [13][14] - 当前AI发展需突破数据瓶颈,算力与算法已部分解决,高质量数据集是下一阶段重点 [13] 技术挑战与突破方向 - 隐私计算等技术目前效率低、成本高,仅限金融机构高净值客户,需优化联邦学习等以降低应用门槛 [5] - 传统TCP/IP协议等无法保障安全,新兴技术需平衡安全性与流通速率 [5][6] - 数据流通基础设施需融合安全与发展技术,突破历史割裂现状 [5]