国金证券：具身智能迫近临界点关注人形机器人四大潜在商业化场景

文章核心观点 - 人形机器人产业正加速迈向商业化落地，其核心驱动力在于“具身智能”泛化能力的突破，该能力是机器人区别于自动化设备并解锁多元高价值场景的关键[1] - 基于客户类型（ToB/ToC）与泛化层级（大脑/小脑）的差异，人形机器人已形成四大清晰的潜在商业化场景画像[1][2] - 在模型与数据层面，一段式学习系统、大脑与小脑模型的预训练、以及真机、仿真、人类视频三线数据方案在过去一年均取得突破性进展，共同推动行业加速发展[3][4][5][6] 人形机器人四大潜在商业化场景 - ToB+大脑泛化场景：如展厅导览、门店导购、前台导流与巡逻，核心能力是流利流畅的语言智能沟通与亲切的人形姿态，代表案例为小鹏Iron机器人[1] - ToB+小脑泛化场景：特种行业场景，核心能力是类人的运动控制与蜂群协同作战，代表案例为宇树科技在央视春晚节目中实现16台机器人毫秒级协同响应，完成醉拳、后空翻等高难度动作[2] - ToC+大脑泛化场景：个人陪伴场景，核心能力是基于语言智能的情绪价值供给，代表案例为松延动力机器人在春晚节目中展示的唠嗑、玩梗能力，可形成用户数据、情感投射、品牌心智的正向飞轮[2] - ToC+小脑泛化场景：家庭照护场景，核心能力是触视觉协同的长程精细操作能力，代表案例为银河通用机器人使用Sharpa灵巧手完成盘核桃、叠衣服等任务[2] 模型进展：具身智能泛化的三大突破 - 一段式学习系统取得阶段性突破：26年初Figure AI发布Helix 02，新增运动直觉S0系统，能在整个房间范围实现灵巧、长时程的自主行为；同期特斯拉选择让Optimus与无人驾驶共享一套闭环仿真世界模型，并计划用Grok大模型作为机器人集群的高级调度中枢[3] - 大脑侧模型预训练已跨越Scaling Law门槛：25年11月北美创企Generalist AI发布GEN-0，首次验证激活具身智能的参数门槛大约在70亿，其发展路径更偏向数据与工程问题而非复杂科学问题[3] - 小脑侧实现通用运动控制能力突破：25年9月底北美创企Skild AI发布通用小脑，在训练量相对于传统单一模型提升500倍的情况下，意外获得了能跨本体实现运动控制的通用能力，例如在腿部受损的不同机器狗上均展现出快速泛化适应能力[3] - 行业基准测试推动协同进化：李飞飞博士启动首届BEHAVIOR挑战赛，开放总计1,200+小时的10,000条专家遥操作示范数据，有望为机器人时代设定统一基准，推动大小脑协同进化[4] 数据进展：三线交织加速训练 - 真机数据方案实现低成本采集：UMI作为一种轻量化、无本体、低成本的真实数据采集方案，由3D打印的平行夹爪、软指和扳机构成，整套成本约400美金[6] - 仿真合成数据持续迭代并弥补现实差距：英伟达Isaac Sim与索辰开物机器人训练平台持续迭代，北美Skild AI与国内银河通用的实践证明，足够多样性的仿真数据可以一定程度上弥补仿真到现实的差距问题[6] - 人类视频数据加速真实世界理解：Gemini 3.0/3.1 Pro在屏幕理解和抽象推理层面能力显著提升，有望加速解锁机器人理解真实世界的能力，北美Tesla与Figure都已转向使用人类视频数据进行模型训练[6]