Workflow
被王兴兴质疑的VLA,为何自变量机器人CEO王潜坚定看好?

具身智能模型发展路径 - 行业认为达到ChatGPT或GPT-3.5水平需3到5年时间 [2][7] - 硬件已非发展障碍 运动能力达到非常好水平 但当前机器人更多提供情绪价值而非实用价值 [2][13] - 行业共识是需要完全统一的端到端基础模型或通用模型 [2][6] VLA技术路线与模型特性 - VLA技术路线被确认为正确方向 将遵循类似大语言模型的Scaling Law发展路径 [2][7] - 具身模型应是独立于数字世界的物理世界基础模型 而非语言模型延伸 [3][9] - 模型训练需要足够大数据量 尽可能大的模型规模 并在架构和训练方法上持续探索 [3][7] 数据策略与质量挑战 - 复杂物理交互操作拒绝使用仿真数据 导航类任务可大量采用仿真数据 [10] - 数据主要来源包括互联网视频预训练数据 现实机器人采集数据及人类演示数据 [10] - 数据质量控制是研发核心挑战 数据质量直接决定模型性能上限 [12] 应用场景与商业化展望 - 家庭及养老生活场景被判断为最大潜在市场 规模可能超越工业场景 [3][14] - C端产品预计2-4年内进入日常生活 目标价格区间为1-2万美元(约10万人民币) [4][17] - 公司选择软硬一体化商业模式 直接提供完整产品或解决方案而非单纯模型授权 [4][19] 技术实施与产品规划 - 短期聚焦轮式机器人平台 暂不开发双足形态 以室内场景为主要应用方向 [19] - 通过长序列任务训练提升环境泛化能力 但承认该路径会延长商业化周期 [18] - 当前产品优先面向科研市场 逐步向复杂场景推进 [19]