VLA模型走不通,机器人的下一步该怎么走?

核心观点 - 商汤科技联合创始人王晓刚指出,当前主流的视觉-语言-动作模型技术路线面临核心训练数据稀缺的瓶颈,并提出了“以人为中心”的ACE研发范式作为解决方案 [2][7] - 大晓机器人发布了基于ACE范式的开源世界模型,并联合产业链伙伴推动具身智能在多个场景的落地,认为未来一至两年是行业发展的关键时期 [3][5][6][7] 技术瓶颈与范式转变 - 当前VLA模型依赖互联网静态非结构化数据,但训练具身智能真正需要的是连续、动态、三维甚至四维的时空轨迹流数据,物理世界数据的稀缺与复杂性是主要瓶颈 [2] - AI研究范式需要从以机器为中心转变为以人为中心,通过采集人类真实行为数据来学习物理规律,从而训练具身智能的世界模型 [2] - 特斯拉、Figure AI等企业也在向“以人为中心”的方向转变,该赛道尚未收敛,仍在涌现新机会 [7] ACE范式技术体系 - ACE范式以人类与物理世界的互动规律为起点,构建了“环境式数据采集—开悟世界模型3.0—具身交互”的技术体系 [3] - 环境式数据采集整合第一与第三视角视频、力触觉、运动轨迹、语音等多模态数据,构建基于物理基础的3D资产库 [3] - 数据处理通过时序一致性对齐、交互动态轨迹预测建模与物理正确性仿真校正,将“人—物—场”信息转化为可训练的动态场景数据 [3] 开悟世界模型3.0 - 开悟世界模型3.0是首个开源且可商业化应用的世界模型,形成了跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作 [5] - 该模型使机器不仅能“理解”物理世界因果规律,还能“生成”长时动静态交互场景 [5] - 模型产品平台集成了多模态生成能力,内置支持11大类、54细类累计328个标签,覆盖115个垂类具身场景,开发者可通过简单指令快速生成可视化任务模拟内容以降低开发门槛 [5] 产业生态合作 - 在具身本体领域,公司与智元机器人、银河通用、钛虎机器人、国地中心等企业合作,打通ACE技术范式、世界模型与机器人硬件的适配链路 [6] - 在算力侧,开悟世界模型3.0已与沐曦、壁仞科技、中科曙光、辉曦智能、影微创新等多款国产厂商芯片完成适配 [6] - 在硬件领域,公司与Insta360、卧龙电驱、帕西尼等深度绑定,依托其硬件强化世界模型对多视角、动态场景的信息采集能力 [6] 产品落地规划 - 短期内,以具备自主导航能力的四足机器狗为主,在安防、巡检等B端场景快速推广 [6] - 中期,机器人将聚焦前置仓、闪购仓等物流场景,解决人力密集型作业痛点,预计从明年开始国内将出现大量此类场景,需要机器人支持7×24小时服务 [6] - 长期来看,机器人将探索家庭场景,但需解决安全性、责任界定等复杂问题 [6]

VLA模型走不通,机器人的下一步该怎么走? - Reportify