数据金字塔 - 财报，业绩电话会，研报，新闻

数据金字塔

搜索文档

搜狐财经· 2026-02-24 19:17

融资与估值 - 公司于2月24日连续完成两轮融资，总额近20亿元[1] - 融资方阵容覆盖顶级资本、产业巨头、国有资本及战投机构，包括云锋基金、某头部国资、混沌投资、红杉中国、Synstellation Capital、TCL创投、明荟投资、重庆产业投资母基金、杭州金投、360基金、厚雪资本等[1] - 顺为资本、Prosperity7、达晨财智等所有老股东均继续大额认购[1] - 公司成立仅两年即达成百亿估值，成为赛道内兼具技术实力与商业兑现能力的标杆企业[3] 资金用途与战略方向 - 本轮融资资金将重点投入两大方向：一是持续迭代具身智能大模型，深入研究数据规模效应；二是推动技术从单一场景向工业、商用、家庭等多领域快速复制，实现通用能力规模化落地[2] 行业背景与资本趋势 - 根据中国信息通信研究院数据，2025年国内具身智能领域融资总额已达735.43亿元，投资事件超740起[5] - 产业资本在2026年的考察维度已愈发细化，核心关注点从单体智能转向技术落地可行性与规模化场景迁移能力[5] - 公司是唯一一家吸引多元产业资本同时押注的具身智能创业公司，产业股东包括宁德时代、汇川技术、TCL、京东、招商局创投、华为、小米等，实现了对实体经济核心赛道的跨界覆盖[6][7] 技术核心：Spirit模型 - 2026年1月，公司自研的Spirit v1.5具身智能模型成为中国首个性能超越Physical Intelligence旗下Pi 0.5的开源具身模型[11] - Spirit v1.5的核心突破在于零样本泛化能力的大幅跃升，基于视觉-语言-动作端到端统一架构，无需为新任务重新编程即可完成复杂动作[11] - 模型通过海量人类视频数据管线，有效解决了真实世界推理数据稀缺的行业难题[12] - 公司的技术路径与美国头部模型企业Physical Intelligence和Google DeepMind最为接近，聚焦VLA通用操作大脑研发，并更注重与产业需求的融合[11][12] 数据战略与成本优势 - 公司提出“Dirty data is the key to scaling VLA models”观点，认为数据多样性是训练通用模型的关键[17] - 公司已累计超20万小时高质量数据，涵盖互联网人类视频、遥操作、可穿戴设备采集等多类型数据，2026年数据规模预计将突破100万小时[15] - 通过自研的第5代可穿戴式数据采集设备，将数据采集成本降低了90%，降至传统方式的1/10[15] - 公司已跑通批量化数据复制管线，实现模型从被动教学到主动学习的进化[19] 产业落地案例 - 2025年12月，公司墨子机器人正式落地宁德时代电池PACK产线，承担接插件插接作业，已完成近千块电池生产作业[8] - 在宁德时代产线中，墨子机器人线束插接成功率稳定在99%以上，作业节拍达到熟练工人水平[10] - 在商用领域，墨子机器人在京东零售场景中替代人类进行讲解互动与产品操作演示[10] - 公司提供的具身智能方案可适配多品种、小批量、高柔性生产模式，提升生产交互效率与作业灵活性[21] 应用场景拓展 - 公司计划将技术从工业场景延伸，逐步覆盖商用、家庭等更多细分领域[21] - 商用场景覆盖商超零售、酒店服务、巡检安防等，可完成智能导购、自动理货、前台接待、客房清洁、设备巡检等任务[23] - 家庭场景聚焦清洁整理、衣物管理、餐厨辅助等高频家务劳动，实现物品收纳、衣物折叠、基础备餐等操作[23] 团队背景 - 联合创始人兼首席科学家高阳为清华大学背景、UC Berkeley博士，深耕强化学习与机器人跨模态交互，是全球具身智能领域一线领军学者[13] - 团队核心成员多来自UC Berkeley、清华、北大等顶尖学府，平均年龄不到30岁，具备深厚的学术与工程基因，被誉为“不可复制的AI梦之队”[12] - 高阳在伯克利深造期间，与Physical Intelligence创始人Sergey Levine同属BAIR实验室，技术理念趋同[13] 行业展望 - 2026年是具身智能商业化落地密集兑现的窗口期，技术整体走向收敛，垂直场景规模化落地及“一脑多形、跨形态泛化”成为技术迭代核心[24] - 技术收敛降低了迁移复制成本，手握核心技术的企业有望凭借技术壁垒抢占落地先机，推动产业从培育期向成长期跨越[24]

本体无关：Generalist 27万小时要掀真机采集场桌子

36氪· 2025-11-14 08:17

行业核心观点 - 数据竞赛的关键分水岭在于是否回归数据采集的“第一性原理”，即追求可复用、可扩展、可演进的规模化数据流，而非数据方案的路线之争 [1] - 传统执着于单一本体、高成本标注的真机遥操模式难以支撑Scaling Law所需的数据洪流，背离了智能泛化的基本逻辑 [1][24] - Generalist AI的突破重写了具身智能时代的数据法则：打破本体依赖，建立可复用、可扩展的数据飞轮是迎接Scaling Law时代的关键 [25] 具身智能领域的Scaling Law验证 - 2025年11月4日，Generalist AI发布GEN-0具身基础模型，在27万小时人类操作视频数据上完成训练，首次在机器人领域验证了Scaling Law的存在，被业内誉为具身智能的“ChatGPT时刻” [1] - 27万小时的数据量远超目前公开的所有本体机器人数据集，且数据量仍以每周1万小时的速度增长 [3] - Generalist采用了UMI（通用操作接口）方案，使数据采集设备与机器人本体解耦，可在全球数千个家庭、仓库、工作场所灵活部署，实现了真正的规模化数据采集 [12] 真机遥操数据的瓶颈 - 真机遥操数据采集本质是受限于物理世界的线性积累过程，其缓慢的积累速度无法满足Scaling Laws对数据规模的指数级需求 [3] - 典型模式是围绕特定机器人硬件建立线下数据工场，由操作员遥操作真实机器人进行任务演示，其增长严重依赖“堆人头”和实机运行，是线性的 [3] - 物理硬件的“锚定效应”使得数据采集体系刚性且笨重，无法实现灵活、快速的规模化扩展，数据积累速度被硬件能力和可用性锁死 [4] - 真机遥操数据虽质量高，但难以跨形态部署，当机器人本体迭代或需求变化时，此前数据资产难以复用，形成“卖本体”驱动的数据采集模式 [12] - 数据采集消耗大量人力物力，大部分采集员为兼职或外包，影响数据质量，且难以触碰Scaling Law [12] 具身机器人落地的核心需求 - 产业核心命题是倾听具身机器人的“真实需求”，其价值实现核心在于“用起来”的深层逻辑，即场景应用必须同时满足刚需性、长效性与规模经济性的三重诉求 [5] - 真正落地方向是成为人类劳动的“协同伙伴”，将人类从重复性、低价值、高危、高负荷作业中解脱，深度融入工厂生产、商业服务、特种作业等核心产业场景 [5] - 产业落地要求具身机器人跳出“动作复刻”的桎梏，深度理解物理世界的内在肌理与动态运行轨迹，不仅要“会做”，更要“懂做” [6] - 长效落地产业场景的核心难点集中于触觉反馈、力控精度、环境感知等精细化交互能力，而非宏观动作 [6] 精细化交互数据的挑战与价值 - 李飞飞指出，开发机器人的核心挑战是缺乏适用于各种具身形式的训练数据，机器人需要掌握更精细的物理交互数据 [8] - 足量且高质量的精细化数据是具身机器人精准执行任务的“养分”，这部分人类难以言说的数据成为制约其规模应用的重要痛点 [8] - 精细化能力缺失导致诸多“落地试错案例”，如拧瓶盖时压扁水瓶、搭积木时碰倒整排、工业装配中出现零件压损或错位等 [9] - 产业的真正拐点，必将始于在核心能力培育所需的数据供给上取得根本性突破 [9] 数据金字塔与仿真合成数据的潜力 - 行业公认的数据金字塔分为三层：底层是互联网海量公开数据及人类操作视频数据，中间层为仿真合成数据，塔尖是价值密度最高的真机遥操数据 [10] - 仿真合成数据展现出触碰Scaling Law的潜力，且在经济效率上更具优势，同一套仿真场景资产可以适配不同形态的机器人进行训练 [14] - 仿真数据可在虚拟环境中快速生成海量、多样化训练数据，在成本控制和部署灵活性上具有独特优势，能填补预训练数据集的巨大缺口 [16] - 仿真环境可精准模拟触觉反馈、力控阈值等真机实测中难以捕捉的精细化参数，同时通过调整场景变量生成具备场景泛化性的数据 [16] 仿真合成数据的商业实践与技术进展 - 银河通用坚持以仿真技术为核心研发路径，成功推出“银河太空舱”并全国大面积落地，证明了仿真路线在商业转化上的巨大潜力 [17] - 李飞飞强调不会低估高质量合成数据的力量，它们在训练过程的关键步骤中补充了互联网规模的数据 [18] - 光轮智能与NVIDIA合作开发电缆仿真解决方案，能够处理“可变形体+刚体”双重物理属性，为机器人操作线缆等复杂任务提供高保真数据 [20] - 光轮智能建立完整基准测试流程，确保仿真数据有效性，其目标不是“数字孪生”而是生成具有多样性和代表性的“数字同类体” [22] - 光轮通过标准化流程将现有数字资产快速转化为仿真就绪资产，如一个冰箱模型转化时间可缩短至约20分钟，支持单GPU并行运行成百上千个环境 [22] - 光轮智能已实现破亿营收，客户覆盖DeepMind、斯坦福、Figure、阿里、字节等顶尖企业与机构，验证了仿真合成数据的规模化市场价值 [23]

具身智能：机器人打破“专用”枷锁柔性制造迎来新范式

环球网· 2025-08-11 12:10

制造业自动化痛点与转型 - 个性化消费时代的多品种、小批量、高柔性制造需求与传统工业机器人的结构化封闭环境、单一指令模式存在根本性矛盾 [1] - 矛盾推动机器人控制技术从基于精确模型的编程式控制转向基于数据驱动学习的具身智能 [1] - Transformer架构为代表的大模型技术正向机器人领域深度渗透 [1] 具身智能的技术特点 - 具身智能机器人初期在单一场景的效率可能低于专用机器人，通用性与效率呈现负相关 [2] - 具身智能赋予机器"理解"与"规划"能力，突破传统工业机器人依赖精确指令的局限 [4] - 多模态大模型和具身大模型使机器人具备理解模糊任务指令、动作规划与执行的能力 [4] 数据驱动与架构设计 - "数据金字塔"理论包含底层互联网视频文本数据、中层仿真合成数据与动作捕捉数据、塔尖真实场景数据 [5] - 分层构建技术依托多模态预训练底座，利用任务数据和互联网数据构建基础空间理解能力 [7] - "一脑多小脑"模式结合通用"大脑"（基座模型）与专用"小脑"（真机数据微调），平衡通用性与场景效率 [7] 行业落地路径与生态协作 - 具身智能落地将经历"单一结构化场景-半结构化场景-逐步通用"的渐进路径 [7] - 科大讯飞"平台+赛道"战略通过"讯飞超脑2030计划"赋能生态伙伴，推出"即插即用"机器人智能语音背包 [8] - 聆动通用聚焦工业制造、物流及零售领域，牵头起草《机器人自适应能力技术要求》国家标准（GB/T 44589-2024） [8] 行业协同与技术进展 - 世界机器人大会等平台促进产业链上下游合作，加速技术从实验室向产线渗透 [8] - 人形机器人技术进展显著，从去年蹒跚学步到今年稳定行走并完成操作任务 [8] - 机器人正从执行预设程序的"机械臂"进化为理解、规划并适应复杂环境的"智能体" [8]

在人流如织的大街小巷，这家公司的机器人正跑着自己的「马拉松」

机器之心· 2025-05-09 12:19

具身智能发展路径 - 具身智能机器人需建立在商业闭环和真实世界数据闭环基础上才能实现复杂化和智能化[3] - 推行科技通过物流机器人实现商业化运营，构建数据飞轮，形成可持续的发展路径[6] - 行业面临数据稀缺问题，真机数据需通过大规模部署积累，而仿真数据和通识数据同样关键[10] 骑手影子系统 - 系统通过采集骑手环境、定位和驾驶数据训练机器人自主导航能力[13] - 2.0版本扩展至上肢操作数据采集，覆盖开关门、拿放外卖等复杂动作[14] - 中国骑手日均骑行100-200公里，数据采集效率远超行业水平，已积累数千万公里行驶数据和近百万条上肢轨迹数据[14] 机器人技术突破 - 定义"三原色"原子任务（按按钮、推拉门、拿放货），简化复杂操作场景[17] - 开发行为树VLA模型，结合LLM任务规划和VLA执行反馈，提升系统适应性和可靠性[21][23] - 构建多层级反馈机制，使机器人在分布外场景中保持任务稳定交付[24] 商业化进展 - 物流机器人履约率达98.5%，已实现单个机器人盈亏平衡[6] - 与国内三大即时配送平台合作，完成近10万单配送[26] - 模型具备"一脑多形"和"一脑多栖"能力，可跨平台部署至四足机器狗、船只等场景[26] 团队与技术优势 - 团队曾研发DARPA挑战赛全球第二名的人形机器人CHIMP，具备顶尖工程能力[26][30] - 拥有L4级自动驾驶研发经验，为骑手影子系统提供技术基础[27] - 中国复杂城市环境和庞大骑手队伍为数据采集提供独特优势[30]