Workflow
灵初数据采集引擎
icon
搜索文档
对话灵初智能CEO王启斌:花一年把数据成本打下来,比抢着做人形机器人更重要
机器人大讲堂· 2026-03-12 17:57
公司融资与战略定位 - 灵初智能完成天使轮及Pre-A轮融资,合计20亿元,由国家级国资资本、核心产业资本及多家知名基金共同投资 [1][2] - 公司明确自身定位为模型公司,而非典型的硬件公司,其创始团队来自前云迹科技及京东算法团队核心 [2] - 公司选择了一条“反常识”的发展路径:不做核心零部件,不碰移动底盘,不急于打造完整双足人形机器人,而是瞄准“通用灵巧操作” [2] 行业困境与核心策略 - 具身智能行业面临“冷启动难题”,即缺乏高质量、低成本的真实世界操作数据来训练和泛化模型,形成了一个“鸡生蛋”的循环 [3][6] - 公司认为破局的关键在于解决数据来源问题,因此其首要战场是构建数据基建,而非参与双足运动或关节模组的性能竞赛 [6] - 公司策略是专注于制造必须的硬件——数据采集设备,而非核心零部件,因为硬件形态应由模型能力和数据需求定义 [4] 数据采集技术方案 - 公司选择回归“人本”,采集人类的多模态操作数据,而非采用类似UMI(人持夹爪)的范式,后者数据无法泛化到五指灵巧手 [6] - 公司推出的“灵初数据采集引擎”是一个集成视觉(多视角)、触觉(压阻/电容)和21个关节角信息的复杂系统,旨在学习人类操作的底层逻辑 [7] - 通过“重定向”技术,将人类操作意图映射到不同结构、自由度的机器人本体上,使预训练模型能适应多种硬件形态 [7] - 该数据采集设备的硬件投入成本仅为真机遥操作方案的十分之一,并计划推出便携式版本以进一步降低成本,未来探索“众包”模式实现去中心化数据回流 [10] 商业化落地场景 - 公司选择物流场景进行商业化落地,聚焦于衣服供包、入箱拣选、分拨墙等具体环节,作为模型能力的“试金石” [10] - 物流场景远比简单的“抓取-放置”复杂,涉及拆箱、理货、挂物、开关门等十几个动作序列,对机器人综合能力要求极高 [10] - 物流场景中物品形态多样(如衣物、瓶罐、不规则包裹),对视觉识别、柔性抓取、轨迹规划和力控构成综合性挑战 [12] - 公司在衣服供包场景的节拍已达到800 UPH(每小时单元数),处于国内最高水平,并已进入客户现场陪产阶段 [12] 技术管线与模型迭代 - 公司技术管线形成完整闭环,类比大语言模型训练过程:1) 预训练:利用数据手套大规模采集人类操作数据,培养广泛泛化能力;2) 后训练:在特定真机上采集少量(约100小时级)遥操作数据,使模型适配具体“身体”结构;3) 真机强化:通过强化学习提升任务成功率和节拍;4) 端侧推理与纠错:部署中人工介入处理异常案例,数据回流迭代模型 [13][14][15] - 预训练数据决定泛化能力广度,后训练与强化数据决定具体场景性能高度,分层体系确保公司兼顾通用性与落地能力 [17] 行业展望与公司目标 - 公司认为具身智能是一个长达十年的长周期赛道,目前处于早期阶段,硬件百花齐放的第一波浪潮已过,当前正迎来以数据为核心的第二波浪潮 [18] - 公司的目标是到2026年,将真实世界的人类操作数据规模提升至百万小时级别,并基于此训练出高度泛化的预训练模型 [18] - 公司计划围绕数据采集设备销售、数据资产变现以及场景解决方案交付,建立多元化的商业模式 [18]