Workflow
枢途科技获数千万元融资!低成本、大规模、高质量,多模态方案,目标年底开源10万条!
机器人大讲堂·2025-10-12 10:08

枢途科技融资与公司动态 - 枢途科技于10月11日完成数千万元天使轮融资,由东方富海及兼固资本联合领投,此前在2024年已获得奇绩创坛数百万元融资 [1] 具身智能行业数据挑战与现状 - 高质量具身智能数据采集面临成本高、规模小、场景多样性稀缺等核心问题 [1] - 行业主流解决方案依赖人工数据采集,2025年上半年上海、北京及合肥等地已构建多个大型数采中心 [1] - 上海张江机器人谷累计投放近百台数采机器人,北京石景山部署超108台机器人,合肥预训练场预计年底实现超100台机器人在30个以上场景作业 [3] - 单台数采设备成本从几万到十几万不等,现有低成本方案在通用性与效率上无法满足行业发展需要 [3] - 解决“低成本、高通用、多模态”具身智能数据问题的企业将获得行业话语权 [3] 行业技术范式转变 - 特斯拉Optimus放弃动作捕捉和远程操控,转向基于互联网视频的“纯视觉”AI训练模式 [4] - 特斯拉目标让Optimus直接从人类执行任务的互联网视频中学习 [5] - 行业共识认为传统遥操作和动捕技术因高成本和难以规模化已成为发展瓶颈,利用海量、低成本的互联网视频资源是理想选择 [8] 枢途科技SynaData系统技术突破 - 枢途科技于今年7月发布全球首个从互联网RGB视频提取具身训练数据的全链路解决方案SynaData系统 [8] - 该系统实现视频数据升维、跨域重定向等技术突破,将具身数据综合采集成本降至行业平均水平的千分之五 [9] - 系统核心突破在于从2D视频中挖掘出内嵌的空间和物理交互等高维信息 [10] - 技术流程包括利用高精度三维重建将2D视频转为带深度信息的3D内容,重建平均精度达5毫米以下,并能测算被遮挡部分 [12] - 系统会精准提取毫米级手-物交互轨迹、物体网格模型及动力学参数等关键模态 [14][15] - 生成的数据已通过第三方具身模型验证,在清华RDT、PI π0等开源模型上表现出色 [17] SynaData系统的竞争优势与行业影响 - 系统只需输入目标视频,一周内即可生成批量具身数据,无需仿真环境搭建等额外开销 [19] - 系统已累计处理数千小时视频数据,其中80%可直接转化为训练数据,仅20%复杂场景需人工微调 [21] - 系统构建“UMI raw data”中间态,通过重定向技术将数据映射到不同形态机器人,未来支持超100种机器人本体 [21] - 与特斯拉、Skild AI等国内外研究机构不同,枢途科技SynaData系统打造的具身智能数据面向全行业开放,已适配多个开源VLA模型 [22] - 在测试中,仅输入20余条人类抓握视频数据,模型即可实现一定成功率的抓握动作,展现出色泛化能力 [24] 未来发展规划与愿景 - 短期内具身智能数据领域将呈现遥操作数据、合成数据、视频提取数据多元化共存格局 [24] - 枢途科技定位SynaData为“具身数据基础设施”,为基座VLA模型提供大规模、多模态预训练数据 [24] - 公司计划于今年第四季度发布首个基于真实场景视频的多模态具身开源数据集,初步目标为“万条级”,并冲击“10万条级” [25] - 开源数据集重建精度将从5毫米以下提升至2毫米以下,具备高通用性,支持模型厂商自由标注与映射 [25] - 公司倾向“数据基础设施第三方化”,模型厂商可专注于算法创新而无需自建数据采集能力 [27] - 公司已在商超场景通过布设单目摄像头采集视频,持续完善数据飞轮 [27]