具身智能与VLA模型发展 - 灵初智能发布Psi-R1大模型,声称是真正的VLA模型,能在开放场景下解决长程复杂任务[2] - 2025年以来至少有七家企业发布VLA相关模型,包括Physical Intelligence、英伟达、银河通用等[2] - VLA模型成为机器人厂商展示技术先进性的重要手段,但部分展示视频可能掩盖真实技术能力[7] 机器人进厂打工的挑战 - 人形机器人从实验室到实际工厂应用需经历漫长的概念验证阶段,目前大部分仍处于试用期[2][10] - 概念验证需证明技术成功率、可靠性、效率、成本和收益,是商业化落地的关键障碍[3] - Figure机器人被曝在宝马工厂实际仅有一台执行简单搬运任务,与展示视频存在差距[10] VLA模型的技术难点 - 动作信号输入是VLA模型的核心难点,缺乏动作输入会导致泛化性不足和长线推理偏差[5] - 真正的VLA模型需具备长时序动作执行能力、跟随描述性语言指令并由单一模型完成所有任务[8] - 当前部分VLA模型仅通过模仿学习加原子技能调用完成简单操作,缺乏自主推理能力[7] 机器人落地的工程化流程 - 工厂落地需经历三个阶段:3个月实验室环境内测、3个月客户场景验证、6个月有人陪产部署[12] - 实际工厂环境中存在光线干扰、电磁干扰、流程差异等问题,需针对性优化[12] - 部署阶段需应对人为打断等突发情况,要求上层大脑具备实时推理和决策能力[13] 人形机器人的应用场景选择 - 当前进厂机器人多从事搬运、检测等基础工种,如优必选S1进行物料搬运和车灯检测[14] - 未来目标应是替代人力完成自动化设备无法胜任的精细化工作,如3C制造质检[14] - 客户更关注落地可行性而非技术完美性,需平衡长程推理能力与实时控制要求[15]
进厂“试用期”一年,人形机器人“转正”还要跨过几道坎?