对标英伟达EgoScale数据路径,清华系孵化星忆科技拿到首轮融资
英伟达英伟达(US:NVDA) 36氪·2026-03-27 16:04

行业趋势与数据范式迁移 - 具身智能领域的数据竞赛焦点正从“谁采得更多”转向“谁能把Human-centric/Ego-centric数据做成高自由度、高精度、低成本、可训练的资产” 这标志着一场明确的数据范式迁移 [2] - Ego-centric(人类第一视角)数据因其包含真实物理交互和多模态感知细节 正迅速成为最关键的数据采集路线 其价值在于弥补第三人称视频缺少接触细节、仿真数据难以覆盖真实物理长尾、以及纯遥操数据昂贵稀缺的不足 [2] - 行业头部玩家如NVIDIA已发布EgoScale数据与训练框架 该框架使用20,854小时带动作标注的第一人称人类视频进行训练 并观察到数据规模与验证损失之间接近对数线性的scaling law [1] - 其他市场参与者也在积极布局 例如1X通过Sunday项目采集百万小时级家庭场景视频 光轮智能采用混合路线宣称累计交付突破100万小时数据 估值飙向十亿美金 [1] 公司概况与融资情况 - 星忆科技是一家聚焦Ego-centric数据采集的创业公司 已完成千万级首轮融资 由清华系水木创投领投 泉士资本、神州通誉系钥卓资本等跟投 [3] - 公司孵化自清华大学计算机系 创始人宋知珩曾任智元机器人全尺寸双足人形整机产品负责人 并负责相关数采与遥操体系建设 此前是镁伽机器人前20号员工 有从0到1的产品开发与量产经验 [3] - 公司核心团队技术班底来自清华、北航等高校 并吸纳了埃夫特、海康威视等产业专家 在相关领域累计发表顶级会议和期刊论文70余篇 [4] - 公司定位为“具身智能的物理数据基础设施” 旨在通过自研的高精度穿戴设备与数据引擎 将人类操作经验转化为机器人可学习的数字养料 [5] 技术路径与核心优势 - 公司对标英伟达EgoScale技术路径 但构建了差异化的数据采集软硬件体系 其路线不做二指夹爪式UMI 而是追求高自由度基础上的高精度 并融合视觉、触觉与姿态多模态数据 试图打通从采集到训练的完整闭环 [5] - 公司认为真正有价值的真机数据需同时满足五个条件:真实、精准、高自由度、低成本、可训练 公司当前最突出的优势集中在精度与自由度两端 [5] - 公司的技术核心在于高质量的多模态信号采集与高精度标注 特别是在手部理解这一高难度领域 公司声称具备全球领先的能力 能将数据引擎的标注能力稳定推到毫米级 [12] - 在多模态融合方面 公司强调触觉信息对于精细操作不可或缺 它提供了接触状态、摩擦变化和微滑移信息 是视觉的终点也是力控的起点 [13] - 公司攻克了在佩戴手套(包括黑色手套)情况下进行高精度手势识别的技术难题 这为在真实生产场景中融合视觉、触觉和姿态数据奠定了基础 [14] 数据采集与处理能力 - 公司的数据采集流程是一个流式过程:采集员在真实产线佩戴穿戴套件操作 数据引擎实时捕捉多模态信息并进行毫秒级对齐 形成可张量化的训练数据 [17] - 公司通过自研的数据引擎实现了低成本、高质量的标注 传统人工标注一秒钟三视角视频(30帧)成本约3元人民币 而公司的标注引擎成本是传统人工的“几百分之之一” 且精度更高 [15] - 公司通过内嵌的“质量审计引擎”自动剔除抖动、丢帧等不合理动作以保证数据质量 [18] - 公司计划在今年陆续开源1000至10000小时的高精度数据集 以推动行业共建 [18] 市场竞争与商业模式 - 公司将其与UMI(通用操作接口)路线的本质区别定义为目标函数不同:UMI优先解决低门槛、可迁移、可扩展 而公司优先解决在高自由度前提下 将决定精细操作上限的信号采全、采准、采成可训练资产 [21] - 公司认为二指夹爪是工业化遗留产物 而AGI要求泛化能力 因此公司致力于服务高自由度的灵巧手(如人手有21个自由度) [21] - 公司的商业模式路径清晰:第一步服务高校和顶级实验室(科研需求) 第二步切入机器人本体和模型厂商(训练需求) 第三步触达最终场景方(落地需求) [23] - 公司提供两类标准产品:售卖穿戴硬件和数据集 对于只想快速提升模型效果的客户 可直接购买成品数据集并获得技术支持 [23] 行业认知与发展展望 - 公司用“数据金字塔”模型理解行业:底层是规模最大的互联网数据 往上依次是仿真/合成数据、第一人称人类多模态真实数据、以及顶层的真机遥操数据 越往上数据量越小但价值密度越高 行业当前最缺的是能进入复杂接触又能被模型有效消化的高质量真实数据 [19][21] - 公司判断具身智能落地时间表为“3年进工厂 5年进家庭” 工厂指特定场景单一任务 家庭则需要模型具备泛化能力 目前行业整体仍处于POC阶段 纯端到端方案准确率通常只有70%–80% [27] - 公司认为下一阶段竞争的关键在于系统效率 即谁能率先建立高标准数据资产的规模化生产能力 并构建一套从真实世界持续学习、持续回流的系统 [28] - 关于数据规模天花板 公司认为最终会落在一亿小时这个量级 但这必须是最高质量的数据 用以形成“具身基因” [25]

Nvidia-对标英伟达EgoScale数据路径,清华系孵化星忆科技拿到首轮融资 - Reportify