数据金字塔
搜索文档
本体无关:Generalist 27万小时要掀真机采集场桌子
36氪· 2025-11-14 08:17
行业核心观点 - 数据竞赛的关键分水岭在于是否回归数据采集的“第一性原理”,即追求可复用、可扩展、可演进的规模化数据流,而非数据方案的路线之争 [1] - 传统执着于单一本体、高成本标注的真机遥操模式难以支撑Scaling Law所需的数据洪流,背离了智能泛化的基本逻辑 [1][24] - Generalist AI的突破重写了具身智能时代的数据法则:打破本体依赖,建立可复用、可扩展的数据飞轮是迎接Scaling Law时代的关键 [25] 具身智能领域的Scaling Law验证 - 2025年11月4日,Generalist AI发布GEN-0具身基础模型,在27万小时人类操作视频数据上完成训练,首次在机器人领域验证了Scaling Law的存在,被业内誉为具身智能的“ChatGPT时刻” [1] - 27万小时的数据量远超目前公开的所有本体机器人数据集,且数据量仍以每周1万小时的速度增长 [3] - Generalist采用了UMI(通用操作接口)方案,使数据采集设备与机器人本体解耦,可在全球数千个家庭、仓库、工作场所灵活部署,实现了真正的规模化数据采集 [12] 真机遥操数据的瓶颈 - 真机遥操数据采集本质是受限于物理世界的线性积累过程,其缓慢的积累速度无法满足Scaling Laws对数据规模的指数级需求 [3] - 典型模式是围绕特定机器人硬件建立线下数据工场,由操作员遥操作真实机器人进行任务演示,其增长严重依赖“堆人头”和实机运行,是线性的 [3] - 物理硬件的“锚定效应”使得数据采集体系刚性且笨重,无法实现灵活、快速的规模化扩展,数据积累速度被硬件能力和可用性锁死 [4] - 真机遥操数据虽质量高,但难以跨形态部署,当机器人本体迭代或需求变化时,此前数据资产难以复用,形成“卖本体”驱动的数据采集模式 [12] - 数据采集消耗大量人力物力,大部分采集员为兼职或外包,影响数据质量,且难以触碰Scaling Law [12] 具身机器人落地的核心需求 - 产业核心命题是倾听具身机器人的“真实需求”,其价值实现核心在于“用起来”的深层逻辑,即场景应用必须同时满足刚需性、长效性与规模经济性的三重诉求 [5] - 真正落地方向是成为人类劳动的“协同伙伴”,将人类从重复性、低价值、高危、高负荷作业中解脱,深度融入工厂生产、商业服务、特种作业等核心产业场景 [5] - 产业落地要求具身机器人跳出“动作复刻”的桎梏,深度理解物理世界的内在肌理与动态运行轨迹,不仅要“会做”,更要“懂做” [6] - 长效落地产业场景的核心难点集中于触觉反馈、力控精度、环境感知等精细化交互能力,而非宏观动作 [6] 精细化交互数据的挑战与价值 - 李飞飞指出,开发机器人的核心挑战是缺乏适用于各种具身形式的训练数据,机器人需要掌握更精细的物理交互数据 [8] - 足量且高质量的精细化数据是具身机器人精准执行任务的“养分”,这部分人类难以言说的数据成为制约其规模应用的重要痛点 [8] - 精细化能力缺失导致诸多“落地试错案例”,如拧瓶盖时压扁水瓶、搭积木时碰倒整排、工业装配中出现零件压损或错位等 [9] - 产业的真正拐点,必将始于在核心能力培育所需的数据供给上取得根本性突破 [9] 数据金字塔与仿真合成数据的潜力 - 行业公认的数据金字塔分为三层:底层是互联网海量公开数据及人类操作视频数据,中间层为仿真合成数据,塔尖是价值密度最高的真机遥操数据 [10] - 仿真合成数据展现出触碰Scaling Law的潜力,且在经济效率上更具优势,同一套仿真场景资产可以适配不同形态的机器人进行训练 [14] - 仿真数据可在虚拟环境中快速生成海量、多样化训练数据,在成本控制和部署灵活性上具有独特优势,能填补预训练数据集的巨大缺口 [16] - 仿真环境可精准模拟触觉反馈、力控阈值等真机实测中难以捕捉的精细化参数,同时通过调整场景变量生成具备场景泛化性的数据 [16] 仿真合成数据的商业实践与技术进展 - 银河通用坚持以仿真技术为核心研发路径,成功推出“银河太空舱”并全国大面积落地,证明了仿真路线在商业转化上的巨大潜力 [17] - 李飞飞强调不会低估高质量合成数据的力量,它们在训练过程的关键步骤中补充了互联网规模的数据 [18] - 光轮智能与NVIDIA合作开发电缆仿真解决方案,能够处理“可变形体+刚体”双重物理属性,为机器人操作线缆等复杂任务提供高保真数据 [20] - 光轮智能建立完整基准测试流程,确保仿真数据有效性,其目标不是“数字孪生”而是生成具有多样性和代表性的“数字同类体” [22] - 光轮通过标准化流程将现有数字资产快速转化为仿真就绪资产,如一个冰箱模型转化时间可缩短至约20分钟,支持单GPU并行运行成百上千个环境 [22] - 光轮智能已实现破亿营收,客户覆盖DeepMind、斯坦福、Figure、阿里、字节等顶尖企业与机构,验证了仿真合成数据的规模化市场价值 [23]
具身智能:机器人打破“专用”枷锁 柔性制造迎来新范式
环球网· 2025-08-11 12:10
制造业自动化痛点与转型 - 个性化消费时代的多品种、小批量、高柔性制造需求与传统工业机器人的结构化封闭环境、单一指令模式存在根本性矛盾 [1] - 矛盾推动机器人控制技术从基于精确模型的编程式控制转向基于数据驱动学习的具身智能 [1] - Transformer架构为代表的大模型技术正向机器人领域深度渗透 [1] 具身智能的技术特点 - 具身智能机器人初期在单一场景的效率可能低于专用机器人,通用性与效率呈现负相关 [2] - 具身智能赋予机器"理解"与"规划"能力,突破传统工业机器人依赖精确指令的局限 [4] - 多模态大模型和具身大模型使机器人具备理解模糊任务指令、动作规划与执行的能力 [4] 数据驱动与架构设计 - "数据金字塔"理论包含底层互联网视频文本数据、中层仿真合成数据与动作捕捉数据、塔尖真实场景数据 [5] - 分层构建技术依托多模态预训练底座,利用任务数据和互联网数据构建基础空间理解能力 [7] - "一脑多小脑"模式结合通用"大脑"(基座模型)与专用"小脑"(真机数据微调),平衡通用性与场景效率 [7] 行业落地路径与生态协作 - 具身智能落地将经历"单一结构化场景-半结构化场景-逐步通用"的渐进路径 [7] - 科大讯飞"平台+赛道"战略通过"讯飞超脑2030计划"赋能生态伙伴,推出"即插即用"机器人智能语音背包 [8] - 聆动通用聚焦工业制造、物流及零售领域,牵头起草《机器人自适应能力技术要求》国家标准(GB/T 44589-2024) [8] 行业协同与技术进展 - 世界机器人大会等平台促进产业链上下游合作,加速技术从实验室向产线渗透 [8] - 人形机器人技术进展显著,从去年蹒跚学步到今年稳定行走并完成操作任务 [8] - 机器人正从执行预设程序的"机械臂"进化为理解、规划并适应复杂环境的"智能体" [8]
在人流如织的大街小巷,这家公司的机器人正跑着自己的「马拉松」
机器之心· 2025-05-09 12:19
具身智能发展路径 - 具身智能机器人需建立在商业闭环和真实世界数据闭环基础上才能实现复杂化和智能化[3] - 推行科技通过物流机器人实现商业化运营,构建数据飞轮,形成可持续的发展路径[6] - 行业面临数据稀缺问题,真机数据需通过大规模部署积累,而仿真数据和通识数据同样关键[10] 骑手影子系统 - 系统通过采集骑手环境、定位和驾驶数据训练机器人自主导航能力[13] - 2.0版本扩展至上肢操作数据采集,覆盖开关门、拿放外卖等复杂动作[14] - 中国骑手日均骑行100-200公里,数据采集效率远超行业水平,已积累数千万公里行驶数据和近百万条上肢轨迹数据[14] 机器人技术突破 - 定义"三原色"原子任务(按按钮、推拉门、拿放货),简化复杂操作场景[17] - 开发行为树VLA模型,结合LLM任务规划和VLA执行反馈,提升系统适应性和可靠性[21][23] - 构建多层级反馈机制,使机器人在分布外场景中保持任务稳定交付[24] 商业化进展 - 物流机器人履约率达98.5%,已实现单个机器人盈亏平衡[6] - 与国内三大即时配送平台合作,完成近10万单配送[26] - 模型具备"一脑多形"和"一脑多栖"能力,可跨平台部署至四足机器狗、船只等场景[26] 团队与技术优势 - 团队曾研发DARPA挑战赛全球第二名的人形机器人CHIMP,具备顶尖工程能力[26][30] - 拥有L4级自动驾驶研发经验,为骑手影子系统提供技术基础[27] - 中国复杂城市环境和庞大骑手队伍为数据采集提供独特优势[30]