全球首个!灵巧手真实世界具身数采引擎Psi-SynEngine来了,灵初智能发布
机器之心·2025-12-11 08:43

公司产品发布与核心方案 - 公司发布全球首个具身原生人类数据采集方案Psi-SynEngine,该方案为全栈自研,包含便携式外骨骼触觉手套数采套装、大规模in the wild数采数据管线、以及基于世界模型和强化学习的跨本体数据迁移模型[3] - 公司同步发布覆盖视觉、语言、触觉、动作的大规模真实世界多模态数据集Psi-SynNet-v0,标志着其全自研的真实世界具身数据引擎正式启动[3] - Psi-SynEngine方案直接采集一线作业人员在物流、工厂、商超、酒店和家庭等真实场景中的操作数据,无需二次迁移,从根本上突破了行业数据采集的困境[4] 产品技术优势与特点 - Psi-SynEngine相比传统方案具有三大优势:成本低(数据获取成本仅为真机遥操方案的10%)、多模态高自由度(完整采集触觉、视觉、动作、语言数据)、便携性强(可随时随地部署,支持大规模并行采集)[7] - 公司自主研发的外骨骼触觉手套定位精度最高可达亚毫米级别,能完整采集手部和手臂全部自由度及全手触觉信息,且不影响作业人员正常操作[8] - 公司已构建完整硬件与平台体系,包括支持大规模数据处理的自研管线和平台,配合自研大模型完成高精度数据标注与后处理,形成数据生产闭环[8] - 方案的核心技术壁垒在于解决了人手与灵巧手之间的跨本体差异(embodiment gap),通过基于世界模型、强化学习和触觉模态对齐的解决方案,实现人类数据向不同自由度灵巧手的高效迁移[9] 行业痛点与现有方案局限 - 行业现有数据采集方案存在三大痛点:仿真环境数采存在Sim-to-Real差距,仿真分布与真实环境差异导致策略迁移退化和高成本[6];机器人遥操数采难以规模化,呈现碎片化试点,缺乏统一标准,且雇佣专人采集成本过高、效率太低[6];UMI设备数采(双夹爪)难以实现精细操作,且无法在实际生产中同步采集,而美国劳工部数据显示工厂内98.7%以上的工序需要双手多指协同[6] - 数据问题一直是困扰整个具身智能领域的痛点,公司选择聚焦通用灵巧操作战略,因为灵巧手与人手形态差异最小,数据迁移效率最高[4] 数据集价值与未来规划 - 基于Psi-SynEngine发布的Psi-SynNet-v0数据集具备四大核心特征:数据多样性强(覆盖多行业、多场景、多物体与多技能)、模态覆盖全面(囊括视觉、语言、触觉、动作多维度全真值数据)、数据规模海量(量级达到大语言模型同级)、自闭环已验证(已在公司多个落地产业中完成闭环验证)[12] - 公司已内部构建上万小时规模的Psi-SynNet-v0数据集,并计划于明年突破百万小时量级,旨在打造全球最大的灵巧操作数据集,作为训练具身原生大模型的核心资产[10] - 该数据引擎和数据集的发布,标志着基于人类真实操作数据的具身智能新范式确立,为向真实世界的具身AI大模型预训练提供了规模化可能[10] 公司背景与技术积累 - 公司作为国内具身智能科技领域的领军企业,专注通用具身智能、VLA大模型及灵巧操作算法等前沿技术[12] - 公司核心团队来自顶尖高校AI实验室及头部科技企业,拥有深厚技术积累与创新能力[12] - 公司已成功推出行业首个端到端强化学习具身模型Psi R0、R0.5及R1,率先实现长程任务,并兼具泛化性、鲁棒性、灵巧性,获得行业头部客户认可,正加速推进技术商业落地[13]