Workflow
机器人跨越“三重门”——具身智能创新者亲历的现实与趋势

行业现状与趋势 - 人形机器人赛道呈现"冰与火之歌"局面:一方面机器人展示接近人类的肢体能力并进入日常生活场景 另一方面行业融资超百亿但实际订单不足百台[1] - 2025年被视为"人形机器人量产元年" 投资机构从观望转向竞逐 超20家机器人产业链企业走向IPO[1] - 全球首个城市级常态化运营的人形机器人示范区于2025年8月落地北京 由机器人经营的无人超市"银河太空舱"开张[5] 技术发展路径 - 行业形成两大技术流派:以宇树科技为代表的"运动派"专注于腿足控制和全身运动能力展示 以银河通用为代表的"干活派"专注于实际场景作业能力[11] - "干活派"存在两种技术路径:视觉算法+轨迹生成 与端到端VLA(视觉-运动-动作一体化生成)模型[11] - 当前技术瓶颈主要在于数据获取而非硬件或模型 高质量数据的丰富性和准确性决定机器人泛化性和鲁棒性[7] - 数据策略采用99%合成数据+1%真实数据的组合方式:合成数据解决从0到1的问题 真实遥操数据解决从1到100的问题 视频数据处理从100到10000的问题[15] 商业化落地挑战 - 演示视频(demo)与实际产品存在显著差距:demo对可靠性要求低且多在受控环境中运行 实际产品需要具备24小时工作的高可靠性和环境泛化能力[12] - 行业面临"鸡生蛋"困境:没有订单就无力迭代技术 技术不成熟就无法获得订单[41] - 未来3年是行业"生死分水岭" 能找到可击穿场景的企业将留在牌桌 未来1年需实现千台到万台的批量交付才能验证行业价值[18] - 人形机器人单台成本超10万元 加上维修成本更高 而工人年薪仅5-8万元 成本效益比亟待优化[46] 应用场景选择 - 工业场景被视为短期落地重点 银河通用已在流水线搬运、分拣等环节实现规模化应用 并在北京海淀落地10多家智慧药房 计划年内在全国开设100家[12] - 加速进化公司战略性放弃工业场景 因现有专机(机械臂、AGV)已实现高度自动化 且工业数据属于固定不变的"死数据"[47] - 足球赛事成为机器人能力测试场 加速进化帮助中国队在2025RoboCup巴西机器人足球世界杯成人组首次夺冠 打破欧美国家28年垄断[39] - 家庭场景被多家企业视为终极目标 虽然场景更复杂多变 但数据是"活"的且价值空间更大[47] 核心技术突破 - 银河通用2025年初以10亿级合成大数据训练端到端VLA大模型 6月推出端到端导航大模型 使机器人具备"听-看-懂-走"闭环运动能力[13] - 自变量公司开发通用具身大模型WALL-A 实现"一脑多用"的端到端技术 使机器人具备零样本泛化能力[23] - 端到端模型相比传统分层模型优势明显:能通过实时感知决策闭环调整策略 处理动态变化和陌生状况时只需少量样本即可迁移学习[30] - 操作系统被视为真正护城河 当越来越多开发者基于特定操作系统开发 机器人的软硬件能力才能快速迭代和迁移[44] 能力迁移与进化 - 足球场景训练的能力可向其他场景迁移:运动控制层面的动态平衡、敏捷移动能力可迁移到家庭与工业场景 环境感知层面的识别预测能力可迁移到分拣、避障任务[45] - 机器人通用能力分为运动、导航、交互、操作四个维度 操作能力是进厂入户的最关键能力 这也是自动驾驶模型无法直接迁移到机器人的主要原因[36] - 对于"成年"前的机器人 运动能力突破可为数据收集与算法训练提供支撑 推动感知、决策、规划能力提升[41]