Workflow
SynaData数据管线解决方案
icon
搜索文档
从互联网视频提取多模态具身数据、将数采成本降至行业千分之五,具身智能企业获数千万元融资|早起看早期
36氪· 2025-10-13 08:09
公司融资与业务定位 - 枢途科技近日完成数千万元天使轮融资,由东方富海及兼固资本联合领投,资金将重点投入视频具身数据采集管线的持续训练与迭代,加速其为多家头部具身智能企业的数据商业化交付进程 [6] - 公司于2024年成立,专注多模态具身智能数据采集及模型技术的研发与应用,通过融合视觉、语言与环境交互系统,构建能够适应开放场景的通用具身数据平台,以推动具身智能技术在物流、制造与服务等领域的规模化落地 [6] 行业痛点与数据需求 - 训练数据的规模、质量与多样性已成为制约模型性能提升的核心瓶颈,端到端模仿学习依赖大量高质量演示数据且存在因果混淆与泛化脆弱问题,难以适应动态开放环境 [7] - 基于遥操控的数据采集方式受限于硬件成本高、操作效率低、场景覆盖窄等现实约束,成本高昂,难以实现规模化数据生产,行业亟需一种可扩展、低成本、高真实度的数据来源以突破模型能力天花板 [7] 视频数据解决方案的优势 - 互联网视频获取及生产成本低廉,来源于真实物理世界,嵌有客观世界的物理参数及自然规律等高质量、高维度信息,成为行业关注的数据来源 [8] - 特斯拉Optimus预计未来几年将通过YouTube视频自主学习掌握新技能,Figure的Helix已实现完全基于人类自我视角视频训练并在真实环境中实现自主导航 [8] SynaData数据管线技术特点 - 枢途科技自主研发SynaData数据管线解决方案,将互联网采集的海量RGB视频转化为多模态、高精度的具身训练数据,实现综合数采成本降为行业平均水平的千分之五 [10] - 在"拿取外卖袋"任务中,系统从普通人手取袋视频中批量提取手部运动轨迹、物体移动路径、物体三维表面网格等多模态数据,基于该数据集训练的模型对外卖袋的抓取成功率提升至88% [10] 系统进展与未来规划 - SynaData系统已完成全管线技术验证,累计处理数千小时覆盖室内外多种环境的视频内容,产出涵盖抓取、放置、精细组装等逾百种任务类型的标准化数据集,部分数据已在主流开源视觉语言动作模型中应用 [11] - 在精度维度上,公司计划通过动态遮挡建模与多视角重建技术,将轨迹与姿态重建精度从毫米级推进至2毫米以内,为精细操作任务提供数据支撑 [11] - 泛化能力方面,计划将适配本体类型扩展至100种以上,覆盖从人形机器人、灵巧手到各类移动底盘的全谱系硬件,预计于2025年第四季度推出业界首个基于真实场景视频的开源具身数据集 [14][15]
从互联网视频提取多模态具身数据、将数采成本降至行业千分之五,具身智能企业获数千万元融资|硬氪首发
36氪· 2025-10-11 09:04
公司融资与业务定位 - 枢途科技近日完成数千万元天使轮融资,由东方富海及兼固资本联合领投 [1] - 融资资金将重点投入视频具身数据采集管线的持续训练与迭代,加速为多家头部具身智能企业的数据商业化交付进程 [1] - 公司于2024年成立,专注多模态具身智能数据采集及模型技术的研发与应用,旨在构建适应开放场景的通用具身数据平台 [1] 行业痛点与技术背景 - 训练数据的规模、质量与多样性已成为制约具身智能模型性能提升的核心瓶颈 [1] - 端到端模仿学习依赖大量高质量演示数据,且存在因果混淆与泛化脆弱等问题,难以适应动态开放环境 [1] - 基于遥操控的数据采集方式受限于硬件成本高、操作效率低、场景覆盖窄等现实约束,成本高昂,难以实现规模化数据生产 [1] - 行业亟需一种可扩展、低成本、高真实度的数据来源,以突破模型在泛化性、适应性与推理能力方面的天花板 [2] 核心技术解决方案 - 枢途科技自主研发SynaData数据管线解决方案,实现从互联网RGB视频提取多模态具身数据并服务于第三方具身模型 [3][5] - 该方案通过视频数据升维、跨域retargeting等技术,将视频转化为多模态、高精度的具身训练数据,综合数采成本降为行业平均水平的千分之五 [5] - 在具体任务测试中,基于该数据集训练的模型对外卖袋的抓取成功率提升至88%,显示出极强的场景泛化能力 [6] 技术进展与未来规划 - SynaData系统已完成全管线技术验证,累计处理数千小时覆盖室内外多种环境的视频内容,产出涵盖逾百种任务类型的标准化数据集 [7] - 部分数据已在清华RDT、PI π0、智元UniVLA、EquiBot等主流开源视觉语言动作模型中应用 [7] - 在精度维度上,公司计划通过动态遮挡建模与多视角重建技术,将轨迹与姿态重建精度从毫米级推进至2毫米以内 [7] - 泛化能力方面,计划将适配本体类型扩展至100种以上,覆盖从人形机器人、灵巧手到各类移动底盘的全谱系硬件 [7] - 公司预计于2025年第四季度推出业界首个基于真实场景视频的开源具身数据集,旨在打通数据生产-仿真训练-系统部署的全链路 [8]