Nvidia-对标英伟达EgoScale数据路径，清华系孵化星忆科技拿到首轮融资｜早起看早期

行业趋势与范式转移 - 具身智能数据层的全球竞争焦点已从单纯追求数据规模，转向谁能将Human-centric/Ego-centric数据转化为高自由度、高精度、低成本、可训练的数据资产 [4][36] - 行业正经历明确的数据范式迁移，全球头部玩家几乎同时将目光转向以人类第一视角、真实物理交互和多模态感知为核心的Ego-centric数据采集路线 [4][36] - 驱动这一转变的核心原因是，机器人学习的最终目标是在真实物理世界完成正确动作，而第三人称视频、仿真数据和纯遥操数据分别存在缺少接触细节、难以覆盖物理长尾、昂贵且稀缺的局限性 [4][37] 主要市场参与者与动态 - NVIDIA Research在2026年发布EgoScale数据与训练框架，使用20，854小时带标注的第一人称人类视频，验证了数据规模与验证损失间接近对数线性的缩放规律 [3][36] - 公司1X通过Sunday项目采集百万小时级家庭场景视频，光轮智能采用混合路线宣称累计交付突破100万小时数据，估值飙向十亿美金 [3][36] - 创业公司星忆科技完成千万级首轮融资，由水木创投领投，泉士资本、钥卓资本等跟投，枫承资本担任融资顾问 [5][38] 公司星忆科技概况 - 公司定位为具身智能的物理数据基础设施，旨在通过自研高精度穿戴设备与数据引擎，将人类生产力经验转化为机器人可学习的数字养料 [8][40] - 公司孵化自清华大学计算机系，创始人宋知珩曾任智元机器人全尺寸双足人形整机产品负责人及数采与遥操体系负责人，也是镁伽机器人前20号员工，有五次0到1新产品开发及过亿营收经验 [5][38] - 团队技术班底来自清华、北航等高校及埃夫特、海康威视等产业专家，在顶级会议期刊发表论文70余篇，承担多项国家级科研项目 [6][39] 公司核心技术路径与差异化 - 对标英伟达EgoScale，但采取差异化路线：不做二指夹爪式UMI，追求高自由度基础上的高精度；不只采集视觉，而是融合视觉、触觉与姿态；不只提供工具，而是打通从采集到训练的完整闭环 [6][39] - 公司认为真正有价值的真机数据需同时满足五个条件：真实、精准、高自由度、低成本、可训练，当前优势集中在精度与自由度 [6][39] - 与EgoScale的区别在于融合了更多模态（如触觉），并具备更高的场景兼容性，可实现“EgoScale in the wild”，能在真实生产场景中无约束采集 [11][45] 技术细节与能力 - 公司核心技术能力包括多模态采集、细粒度手部理解和高精度标注，手部理解被视为L4-L5级别技术，人体姿态为L2级别 [12][14][47] - 精细操作需要三维视觉、身体姿态及触觉信息，触觉提供接触状态、摩擦变化和微滑移信息，是视觉终点和力控起点 [15][48] - 公司能实现戴手套（包括黑色手套）情况下的高精度手势识别，解决了多模态融合中穿戴状态下稳定完成手部理解的关键难题 [16][49] - 数据引擎标注能力在长序列、强接触条件下可稳定达到毫米级精度，且比人类专家标注具备更强一致性，成本仅为传统人工标注的几百分之一 [17][50] 数据采集策略与成本 - 公司不依赖仿真数据，认为仿真在真实世界复杂接触任务中存在显著sim-to-real gap，仿真数据无法满足“真实”这一核心条件 [18][51] - 数据采集采用流式过程，采集员在真实产线佩戴穿戴套件操作，数据引擎实时捕捉并毫秒级对齐多模态信息，再通过离线工具链自动进行毫米级标注，形成高质量训练数据 [19][52] - 公司通过内嵌的“质量审计引擎”自动保证数据质量，并计划在今年陆续开源1000至10000小时的高精度数据集以推动行业共建 [20][53] 市场定位与商业模式 - 公司提出两个“金字塔”模型：能力金字塔中，决定系统上限的是作业智能层；数据金字塔中，越往上（如第一人称人类数据、真机遥操数据）数据量越小但价值密度越高，行业缺乏的是能进入复杂接触的高质量真实数据 [21][23][54][56] - 与UMI等路线的本质区别在于目标函数不同：UMI优先解决低门槛、可迁移，而公司优先解决在高自由度前提下，将决定精细操作上限的信号采全、采准、采成可训练资产 [24][57] - 商业模式清晰为To B，分三步走：服务高校/实验室、切入机器人本体与模型厂商、触达最终场景方，形成从数采工具到在线引擎再到场景落地的完整商业闭环，售卖穿戴硬件和数据集两类标准产品 [26][59] 行业竞争格局与展望 - 公司认为具身智能的核心竞争是将真实世界经验转化为机器人能力的系统效率竞争，其团队竞争力在于打通了学术、工程和产业间最难衔接的链路 [31][65] - 下一阶段行业拉开差距的关键在于谁能率先建立高标准数据资产的规模化生产能力，并形成从真实世界持续学习、回流、长出能力的系统 [32][65] - 公司预测具身智能落地时间表为“3年进工厂，5年进家庭”，工厂指特定场景单一任务正确率达99%以上，家庭需模型具备泛化能力，目前行业整体处于POC阶段，纯端到端方案准确率约70%–80% [30][64] - 关于数据规模，公司认为最终需求将落在一亿小时最高质量数据的量级，这些数据将形成“具身基因” [28][62] - 公司认为机器人行业需要国家队与产业生态抱团打造，而非单打独斗或简单站队 [29][63]