动作泛化

搜索文档
星海图高继扬:具身智能下半场,应用为王
Founder Park· 2025-06-23 19:44
具身智能行业发展趋势 - 2026年将是具身智能的下半场,核心是应用,供需两侧正在走向成熟[1][34] - 行业已度过全民探索可用场景阶段,市场预期回归理性,应用场景逐渐清晰[1][33] - 当前阶段最有商业价值的是实现对象泛化和动作泛化,而非本体泛化[3][26][27] 具身智能技术发展瓶颈 - 发展缓慢的根本原因是高质量数据缺失,而数据缺失源于缺乏合适的标准本体[4][10] - 需要从电机、整机、遥操作、数据管线到模型五个层面全面成熟[10] - 具身智能是"没有短板的游戏",需要软硬件深度结合,从电机到模型的完整整合[4][5] 数据采集与模型训练 - 将数据采集视为生产活动,已部署几十台机器人在真实场景采集数据[17] - 到第三季度将累计获得1万小时交互数据,覆盖1000+操作对象和300+任务[18] - 预训练解决"本体与物理世界交互的基本法则",需要几千到上万小时交互数据[21][23] - 采用"快慢结合"模型结构,快执行模型参数量约10亿,慢思考模型达百亿级[22] 产品形态与商业化路径 - 核心产品形态是"整机+预训练模型+后训练工具"组合[6][9] - 商业闭环核心在于开发者群体,应用繁荣才能创造价值[28][29] - 计划在2023年8月WRC和9月CoRL开源基础模型和数据集[30] - 当前操作精度达厘米级,速度为人类70-80%,新任务学习需约100条样本[32] 技术指标与泛化能力 - 定义四个泛化维度:对象、动作、场景和本体泛化[24] - 对象泛化指对不同物品执行相同动作,动作泛化指对同一物品执行不同操作[26] - 工站式场景降低了对场景泛化的需求,本体泛化在现阶段商业重要性较低[26][27]