Workflow
可扩展学习
icon
搜索文档
万字长文聊具身智能“成长史”:具身智能跨越了哪些山海,又将奔向哪里
具身智能之心· 2025-08-08 08:08
具身智能发展现状 - 机器人技术进入闭环系统时代,融合感知、行动及软件与物理世界的紧密连接,强调物理定律的重要性[5] - 技术就绪水平(TRL)成为工业应用关键指标,汽车等行业要求达到8-9级成熟度才能获得信任[6] - 过去5-10年机器学习带来显著进步,但物理世界要求99%以上成功率,远高于其他AI领域标准[8] - 行业更倾向从结构化和半结构化环境切入,非结构化环境商业化难度大[9] 技术路线之争 - AGI(人工通用智能)强调端到端学习和泛化能力,但距离实际应用仍有距离[19] - ASI(人工专门智能)专注于特定领域高性能小模型,适合工业实时控制需求[23][24] - 专门模型优势:支持多速率系统、高效实时、易调试、可本地运行[27] - 通用模型优势:开发时强大、适合语义规划和人机交互,但难以满足机器人实时需求[27] 关键技术突破 - 视觉-语言-动作(VLA)模型展现潜力,RT-2X实现跨具身任务执行[39][40] - RT-2成为首个机器人基础模型,基于PaLI-X视觉语言模型改造[41] - RTX跨具身数据集包含34个实验室22种机器人数据,通用模型性能优于专用模型50%[42][43] - 第二代VLA模型采用连续动作分布,如PI-Zero增加动作专家模块处理高频率控制[45][46] 数据与训练方法 - 物理机器人产生的真实数据被视为关键,模拟数据作用有限[69][70][71] - PI-0.5模型仅3%数据来自移动操作器,却能在全新场景执行长期任务[54] - 强化学习(SERL)与基础模型结合,专用策略可生成训练数据提升通用性[87][91] - 未来需解决从数十亿轨迹中筛选最有价值数据的问题[73] 行业应用方向 - 工业领域倾向高混合低产量模式,需要快速适应能力[33] - 操作被视为最具挑战领域,需融合复杂环境理解与精细物理交互[99] - 持续学习、从反馈中学习、自主数据收集将成为未来重点[103][104][105] - 学术界与产业界需协同,选择对失败更宽容的应用场景加速技术落地[95][96] 前沿趋势展望 - 物理AGI实现路径存在分歧:性能优先或能力优先[62][63] - 需构建共享的物理世界常识理解框架,统一导航、移动与操作的方法论[101] - 年轻研究人员应关注根本性问题,超越短期实用性考虑[107] - 行业需要复合型人才,掌握物理、AI、机器学习和大数据科学[106]