纪要涉及的行业和公司 - 行业:机器人行业 - 公司:Figure Helix、逸昌、稀美资源、聚硕、智原、字节跳动、阿里巴巴、华为、百度、优步、特斯拉、木薯资源、惠云钛业、小米、DeepMind、DeepSeek 纪要提到的核心观点和论据 Figure Helix 模型亮点 - 架构创新:采用准分层式框架,大脑为 70 亿参数大模型,结合 500 多小时训练的动作模型,展现超预期泛化能力;快慢系统架构平衡快速反应与泛化能力,运行效率超预期;是首个在嵌入式 GPU 上运行分层式大小脑架构的机器人,降低部署门槛 [1][3][4] - 性能优势:快慢系统通过潜在向量桥接,S1 频率高达 200 赫兹,每 5 毫秒更新一次,解决大脑运行频率低问题,保持运动模块高频输出 [1][5] - 泛化能力:利用开源 VLM 基于千亿级别文本图像对数据集训练,提升家居场景泛化性,能识别未见数据和物体,虽有信息过滤但可通过大量生活场景数据弥补 [1][6] 国内厂商情况 - 复用能力:能快速复用 Figure Helix 系统框架,数据采集和合成速度快,2 - 3 个月可达类似效果;可迅速跟进潜在变量定义和分词处理 [1][8][9] - 数据优势:一周内可生成类似 Figure Helix 500 小时的机器人训练数据,数据本身非显著竞争优势,算法架构下商业化应用完成度更关键 [1][10] - 发展模式:发展模式取决于客户场景需求,国内注重短平快响应需求,多端协同算法效果快;未来产业发展方向国内外有别,国外重长期规划与高效能,国内关注商业落地与即时响应 [15] 国内机器人市场 - 应用场景:落地场景多样,需求不同,厂商有更多机会开发不同应用场景;与美国先开发通用型机器人再调整不同,中国目前本体结构和功能多样,预计未来 5 - 6 年收敛至统一构型 [1][2][16] - 硬件设计:最终硬件设计会趋于统一,双足步态在运动控制等方面超轮式时将成主流,旋转驱动结构将成关节设计主流,人形机器人注重高动态响应和柔性能力 [3][17][18] - 成本控制:目前许多 BOM 成本 10 万左右的重型机器人可实现复杂动作,未来一两年机器人成本预计收敛到 10 万左右,为偏小尺寸小型运输机型 [31] - 产品趋势:今年趋势向小型化发展,全尺寸机器人售价高,客户难接受,未来更多往小型化方向发展 [32] 其他公司情况 - 特斯拉:量产定型时间未明确,预计未来两年有显著进展,但宣称两年后年产十多万台目标夸大;第二代机器人动态性能和运动效果与优步有差距,第三代可能采用类似瑞丰动力和运输等旋转环节运动方案 [29][30] - 互联网公司:字节跳动、华为等进入机器人行业发展可能快,但缺乏制造业相关能力,软硬件结合关键;若通过合作模式,最终拼客户资源,目前进展多在实验室阶段,实际落地场景少 [20] - 小米:自三年前发布首款机器人后,产业化落地几乎无进展,目前多为小团队研究性工作,下月计划发布新进展也不太靠谱 [34] - 华为:主要与生态系统中厂商合作,无自主研发人形机器人产品信息 [35] 其他重要但可能被忽略的内容 - 数据采集中心:上海市政府与中央政府联合推出国际共建的数据采集中心,统一采集数据并免费开放给厂商使用,今年计划引进十家以上药易购机器人,产出 2000 万条数据用于研究开发 [3][28] - 机器人协作训练:机器人协作系统训练需两个操作人员同时操作两个机器人,记录动作和视觉信号形成数据集用于训练模型 [23] - 模型数据应用:Figure Helix 500 小时数据用于 S1 和 S2 模型之后的验证和优化,而非直接训练新的 IC 模型 [24] - VRM 与智捷方案差异:判断动作是否参与 VRM 计算看是否进行 token 化处理,智捷方案动作在 8000 万参数小型动作模型中训练,未经过 VRM tokenization 计算,非对标 VRA 方案 [25] - 机器人协作通讯:当前框架下两台机器人协作无通讯,最多支持两台机器人协作,扩展到更多机械臂会遇数据采集难度增加、条件策略复杂度提高等问题 [27] - 仿真数据应用:仿真数据在 3D 环境搭建,记录多种信息;利用仿真数据训练的机器人在简单任务表现良好,复杂非线性动力学场景需实际采集数据微调;特斯拉因有庞大汽车群体可收集真实驾驶数据,无需依赖仿真数据,其他机器人公司因操作成本高和出货量有限需依赖仿真数据 [35][36] - 协作机器人切入:目前协作机器人系统层面无交流,大脑网络未建立,在分层框架内切入人形机器人领域较难,但未来有望实现云端多智能体大脑框架实现协同工作 [37]
Figure-Helix模型对人形机器人商业化的影响评估