枢途科技融资与行业定位 - 枢途科技于10月11日完成数千万元天使轮融资,由东方富海及兼固资本联合领投,此前在2024年曾获得奇绩创坛数百万元融资 [1] - 公司定位为解决具身智能领域“低成本、高通用、多模态”数据问题的关键企业,旨在掌握行业话语权 [3] 具身智能行业数据挑战与现状 - 高质量具身智能数据采集面临成本高、规模小、场景多样性稀缺等核心问题,行业主流依赖人工数据采集 [1] - 2025年上半年,上海、北京及合肥等地已构建多个大型数采中心,例如上海张江机器人谷投放近百台数采机器人,北京石景山部署超108台机器人,合肥预训练场预计年底实现超100台机器人在30个以上场景作业 [3] - 单台数采设备成本从几万到十几万不等,现有低成本方案在通用性与效率上仍不足 [3] 行业技术范式转变 - 特斯拉Optimus宣布放弃动作捕捉和远程操控,转向基于互联网视频的“纯视觉”AI训练模式 [4] - 行业共识认为传统遥操作和动捕技术因高成本和难以规模化已成为发展瓶颈,利用海量、低成本的互联网视频资源是理想选择 [8] - 除特斯拉外,Skild AI、逐际动力、千寻智能、BeingBeyond等国内外公司均探索视频数据应用 [8] 枢途科技SynaData系统技术突破 - 公司于今年7月发布全球首个从互联网RGB视频提取具身训练数据的全链路解决方案SynaData系统 [8] - 系统实现视频数据升维、跨域重定向等技术突破,将具身数据综合采集成本降至行业平均水平的千分之五 [9] - 技术流程包括:利用高精度三维重建将2D视频转为带深度信息的3D内容,重建平均精度达5毫米以下,并能测算被遮挡部分 [12];从中提取毫米级手-物交互轨迹、物体网格模型及动力学参数等关键模态 [14][15] - 系统已通过第三方模型验证,在清华RDT、PI π0等开源模型上展现杰出训练效果 [17] SynaData系统的数据价值与行业影响 - 系统累计处理数千小时视频数据,其中80%可直接转化为具身智能训练数据,仅20%复杂场景需人工微调 [21] - 通过构建“UMI raw data”中间态,利用重定向技术将数据映射到不同形态机器人(如人形机器人、机械臂、AGV/AMR等),实现数据标准化与规模化复用,未来计划支持超100种机器人本体 [21] - 系统定位为“具身数据基础设施”,为基座VLA模型提供大规模、多模态预训练数据 [24] 市场竞争格局与公司差异化 - 特斯拉、Skild AI、Deepak Pathak、Pieter Abbeel等国际团队及北大卢宗青团队、清华大学朱军团队等国内机构均在研究2D视频转3D具身数据,但均服务于自身模型且未开放数据,规模量级较小 [22] - 枢途科技SynaData系统面向全行业开放,已适配清华RDT、PIπ0、智元UniVLA、EquiBot等多个开源VLA模型 [22] 未来规划与数据开源计划 - 公司计划于今年第四季度发布基于真实场景视频的多模态具身开源数据集,初步目标为“万条级”,并冲击“10万条级”,远超当前行业“几万条即算大型数据集”的水平 [25] - 数据集重建平均精度将从5毫米以下提升至2毫米以下,具备高通用性,支持模型厂商自由标注与映射 [25] - 公司倾向“数据基础设施第三方化”,通过商超等场景布设单目摄像头持续采集视频数据,完善数据飞轮 [27] 行业前景总结 - SynaData系统通过挖掘2D视频资源,将数据转化为行业可复用的资产,有望突破具身模型Scaling Law,推动产业化落地 [28] - 解决数据低成本、批量化转化问题被视为打通具身智能落地“最后一公里”的关键 [28]
从互联网视频中挖“具身数据金矿”,枢途科技完成数千万元天使轮融资
机器人大讲堂·2025-10-13 09:29