Workflow
机器人大模型深度报告:我们距离真正的具身智能大模型还有多远?

人形机器人产业化关键 - 人形机器人产业化需突破传统工业机器人"控制刚、泛化弱"局限,增强对不确定性的理解与适应能力 [1] - 工业机器人依赖确定性控制逻辑,缺乏感知与决策能力,导致成本高、通用性差 [1] - 人形机器人以"通用智能体"为目标,需依托大模型实现多模态理解与泛化能力,适应复杂任务 [1] - 当前多模态大模型为人形机器人提供初级智能,但整体仍处于L2初级阶段 [1] 机器人大模型进展 - 架构端:从SayCan语言规划模型到RT-1端到端动作输出,再到PaLM-E、RT-2多模态融合,形成"感知-任务理解-动作生成"完整链条 [2] - π0模型动作输出频率达50Hz,Helix架构控制频率突破200Hz,提升操作流畅性 [2] - 数据端形成互联网、仿真、真机动作三类数据协同体系,真机数据依赖高精度动捕设备 [2] - 训练范式从"低质预训练+高质调优"转向结构优化,光学动捕或成具身模型核心数据来源 [2] 大模型未来发展方向 - 模态扩展:从视觉、语言、动作向触觉、温度等感知通道延伸 [3] - 推理机制:Cosmos等架构通过状态预测赋予机器人"想象力",构建"世界模型"提升环境推理能力 [3] - 数据构成:仿真与真实数据融合训练成为主流,高标准训练场为通用机器人关键支撑 [3] 投资标的 - 模型端关注银河通用、星动纪元、智元机器人(一级公司) [4] - 数据采集领域关注青瞳视觉(一级)、凌云光(688400)、奥比中光(688322) [4] - 数据训练场领域关注天奇股份(002009) [4]