Figure
搜索文档
英伟达主管!具身智能机器人年度总结
具身智能之心· 2025-12-29 20:50
文章核心观点 - 英伟达机器人主管Jim Fan认为,机器人领域在2025年仍处于缺乏统一标准、硬件可靠性制约软件迭代的“蛮荒时代”,当前主流的VLA技术范式也存在结构性问题 [1][11][13] 行业现状与核心挑战 - 硬件进展快于软件,前沿硬件(如Optimus、e-Atlas、Figure、Neo、G1)的潜力未被AI完全发挥,机器人“身体”能力强于“大脑”指令 [11][14][15] - 硬件可靠性严重不足,过热、马达损坏、固件问题频发,需要整个运维团队维护,错误不可逆,这限制了软件的快速迭代速度 [16][17][18][30] - 领域缺乏统一、可复现的标准评测体系,基准测试是一场“史诗级灾难”,在硬件平台、任务定义、评分标准等方面均无共识,导致人人都可通过定义新基准宣称达到SOTA [8][9][20][21] 主流技术范式(VLA)的局限与未来方向 - VLA(视觉-语言-动作模型)是2025年机器人领域最热的词汇,当年发表了超200篇相关工作,它赋予机器人处理多模态信息的大脑,具备任务泛化能力 [44][45][47] - 当前基于VLM(视觉-语言模型)的VLA范式存在根本性结构问题:VLM是为视觉问答优化,其大多数参数服务于语言和知识,而非物理世界;其视觉编码器会丢弃对灵巧操作至关重要的低层细节 [11][24][26][27][49] - VLA的性能不会随VLM参数规模增长而线性提升,因为预训练目标与机器人控制不对齐 [26][51] - 未来方向包括:转向以**视频世界模型**作为更合理的机器人策略预训练目标,因其天然编码时序动态与物理规律 [28][53];发展整合物理驱动世界模型的VLA,统一语义指令与物理精度 [50];采用“形态无关表征”解耦规划与控制,实现零样本跨具身迁移,而非盲目堆叠参数 [51] 硬件与数据进展 - 2025年涌现多款新硬件本体,如Figure03、宇树H2、众擎T800、小鹏IRON机器人、智元精灵G2,它们在运动能力上表现亮眼,大型机器人已能像小型机器人一样灵活 [33][35] - 核心工程挑战在于如何在维持高性能的同时,提升硬件的抗摔性、电池发热、长时间运行稳定性等可靠性问题 [35] - 数据在具身智能领域的重要性已不言自明,数据规模存在Scaling Law,例如Generalist项目证明数据越大、参数越高,模型表现越好 [36][37][43] - 数据采集方式多样,如Sunday机器人利用技能捕捉手套能以近90%的成功率转换人类动作为机器人数据,Egocentric-10K数据集汇集了1万小时工作数据 [38][40][42] - 具体数据路线(人类中心采集、真机遥操、仿真、互联网数据等)及模态配比仍是未收敛的开放问题 [43] 数据与评测的未来趋势 - 未来数据范式可能转向 **“模拟优先、失败为中心”** ,依赖高保真模拟环境生成多样化轨迹,并充分利用失败轨迹学习,以提高数据利用效率和可持续性 [54][55][56] - 现有评测标准过于依赖二元成功率,未来需进行更全面的能力评估,以反映鲁棒性、效率和安全裕度 [56] 市场前景与产业动态 - 机器人产业市场前景广阔,据摩根士丹利研究,其规模有望从当前的910亿美元激增至2050年的25万亿美元 [57] - 硅谷科技巨头(除微软/Anthropic外)均已加码机器人软/硬件布局 [59]
具身智能机器人年度总结,来自英伟达机器人主管
量子位· 2025-12-29 17:01
文章核心观点 - 英伟达机器人主管Jim Fan认为,尽管2025年机器人硬件取得显著进展并出现大量演示,但整个机器人领域仍处于“蛮荒时代”,存在硬件可靠性不足、基准测试混乱、主流技术范式存在结构性缺陷等核心问题 [1][11][13] 硬件进展与瓶颈 - 2025年涌现出如Optimus、e-Atlas、Figure、Neo、G1、Figure03、宇树H2、众擎T800、小鹏IRON机器人、智元精灵G2等前沿硬件,其运动能力(如翻跟头、步态控制)已明显超出年初平均水平,证明大型机器人也能非常灵活 [15][33][35] - 当前机器人硬件能力(身体)已明显强于AI大脑能发出的指令,硬件进展快于软件 [11][16] - 硬件可靠性严重不足(如过热、马达损坏、固件问题),需要整个运维团队维护,其不可逆的错误限制了软件迭代速度,成为被低估的瓶颈 [11][14][17][18][19][29] - 行业面临的核心工程挑战是在维持高性能的同时,提升硬件的抗摔性、电池发热管理及长时间运行稳定性 [35] 软件、模型与技术范式 - Vision-Language-Action模型是2025年机器人领域最热门的模型范式,仅2025年一年就发表了超过200篇相关研究工作 [45][46] - VLA模型旨在为机器人提供能同时处理视觉、语言和动作信息的大脑,使其具备任务泛化能力 [48][54] - 当前主流技术路线是基于视觉-语言模型嫁接动作模块,但该范式存在结构性缺陷 [11][24][25] - VLM本质是为视觉问答等任务优化,其视觉编码器会主动丢弃对机器人灵巧操作至关重要的低层物理细节,且其庞大的参数服务于语言知识而非物理世界 [26][30][50][51] - VLA模型的性能不会随VLM参数规模增长而线性提升,因为预训练目标与机器人控制任务不对齐 [26][52] - 视频世界模型被视为更合理的机器人策略预训练目标,因其天然编码时序动态与物理规律,未来趋势是将其能力嫁接至VLA,或将其作为解耦的内部模拟器以实现显式规划 [27][53][55] 行业基准与数据 - 机器人领域缺乏统一的基准测试共识,在硬件平台、任务定义、评分标准、模拟器使用等方面均无标准,导致每次演示都可能临时定义新基准,可复现性和科学规范缺失 [21][22][23] - 数据对塑造机器人模型能力至关重要,2025年出现了证明具身智能Scaling law的案例,显示数据规模、模型参数与任务表现正相关 [32][37][38] - 数据采集方式多样,如Sunday机器人利用技能捕捉手套能以近90%的成功率转换人类动作为机器人数据,Egocentric-10K数据集汇集了1万小时工作数据 [39][41][42] - 具体数据路线尚未收敛,人类中心采集、真机遥操、仿真及互联网数据等多种模态和配比仍是开放问题 [44] - 未来数据范式可能转向“模拟优先、失败为中心”,即利用高保真模拟生成多样化轨迹,并充分利用失败轨迹进行学习 [56][57][58] - 现有评测标准过于依赖二元成功率,未来需进行更全面的能力评估,涵盖鲁棒性、效率和安全裕度 [59] 市场前景与产业动态 - 据摩根士丹利研究,机器人产业规模有望从当前的910亿美元激增至2050年的25万亿美元 [60] - 除微软和Anthropic外,硅谷主要科技巨头(如Google、Amazon、OpenAI、Meta、xAI/Tesla、Nvidia、Apple)均已加码机器人软件或硬件布局 [62][63]
机器人产业ETF(159551)涨超0.9%,机构称人形机器人商业化需突破成本与效率瓶颈
每日经济新闻· 2025-12-24 15:33
文章核心观点 - 人形机器人在工业场景的商业化核心在于实现投资回报率目标,需满足售价降至十万元级别、效率匹敌人工、两年内回本等条件[1] - 人形机器人与传统工业机器人形成互补定位,前者适用于柔性化、非结构化场景,后者专注于固定工位的高精度重复作业[1] - 预计到2035年,中国工业场景三大重点领域的人形机器人总需求量将达48.4万台,对应市场空间超过480亿元人民币[1] 人形机器人商业化挑战与要求 - 商业化核心卡点是投资回报率,需实现2年回本的最低目标[1] - 为实现此目标,机器人售价需降低至十万元级别,且效率需提升至人工水平[1] - 具身大脑发展滞后,处理复杂长链条任务能力不足,泛化性能有待提升[1] - 精细操作能力是另一大难关,灵巧手的耐久度、灵活度、力度控制需要突破[1] 人形机器人在工业场景的应用定位与前景 - 在工业场景优先适配搬运与质检类任务[1] - 与工业机器人形成互补:工业机器人专注固定工位的高精度重复作业,人形机器人体现柔性化特点,适配非结构化场景和小批量多品类任务[1] - 泛化性能提升后,可向更多工业工序拓展[1] - 预计到2035年,中国工业场景中汽车制造、电子制造、物流仓储三大领域的人形机器人总需求量达48.4万台,市场空间超480亿元[1] 行业参与者与产品 - 特斯拉、小鹏等车企被认为具备技术与场景优势,正推动人形机器人在工业场景落地[1] - Walker系列、Figure等产品被视为典型代表[1] 相关金融产品 - 机器人产业ETF(159551)跟踪机器人指数(H30590)[1] - 该指数聚焦机器人产业相关企业,选取涉及机器人研发、制造及应用的上市公司证券作为样本[1] - 指数覆盖工业自动化、服务型机器人等前沿领域,旨在全面反映机器人行业的技术创新与整体发展表现[1]
具身智能产业深度研究(七):新一代“蓝领”:人形机器人如何站上工厂流水线
海通证券· 2025-12-17 14:28
报告行业投资评级 - 报告未明确给出行业投资评级 [1][2][3][4][9][10][11][12] 报告核心观点 - 工业场景中,人形机器人优先适配搬运与质检类任务,商业化重点关注投资回报率,自主泛化能力提升后可向更多工序拓展 [1][3][9][10][11] - 人形机器人与工业机器人形成互补定位,从短链条任务起步,轮式形态将成为工业场景应用首选 [2][10][16][30] - 预计到2035年,中国工业场景中汽车制造、电子制造、物流仓储三大领域人形机器人总需求量达48.4万台,市场空间超480亿元 [1][4][12][75] 根据相关目录分别进行总结 1. 核心观点:工业场景人形机器人优先适配搬运与质检类任务,商业化重点关注ROI,自主泛化能力提升后可向更多工序拓展 - 人形机器人优先适配搬运与质检类任务,并向基础组装拓展,商业化核心卡点是投资回报率 [1][3][10][11] - 要实现2年回本的最低目标,机器人售价需降低至十万元级别,且效率提升至人工同等水平 [3][11][67] - 具身大脑发展仍然滞后,处理复杂长链条任务能力不足,泛化性能提升后人形机器人可向更多工序拓展 [1][3][11][72] - 预计到2035年,中国工业场景中汽车制造、电子制造、物流仓储三大领域人形机器人总需求量达到48.4万台,市场空间483.6亿元 [1][4][12][75] 2. 工业制造柔性化需求提升,人形机器人从短链条任务起步,轮式形态将成为首选 - 人形机器人与工业机器人根据能力差异形成互补定位,工业机器人专注于固定工位的高速、高负载、精准重复作业,而人形机器人体现出柔性化特点 [2][10][16][17] - 人形机器人在工业场景的最终目标是执行通用复杂长任务,初步落地阶段先从短链条任务起步,不断积累作业数据进行训练 [2][10][23][26] - 三大应用场景中,工业场景因标准化程度较高成为具身智能的训练场,采用渐进式部署策略 [2][10][28] - 轮式形态具备稳定性、长续航、移动速度快的优势,将成为工业场景应用首选 [2][10][30] 3. 优先适配搬运与质检类任务,商业化重点关注ROI - 以汽车制造和电池组装产线为例,搬运类、质检类任务普遍具有半柔性特征、人工参与度高,且为短链条、工序相对独立,人形机器人能够优先胜任 [3][11][32][47] - 对于基础组装类任务,如螺丝预拧紧、零件预安装等,人形机器人尚在初步测试阶段 [3][11][45][47] - 投资回报率决定商业化落地,按照回本周期2年的最低目标反推,假设工人年薪8万元,机器人售价需降低至16万元,而目前售价多在30-50万元区间 [67] - 部分发达国家劳动力短缺、人力成本高,人形机器人的商业化闭环有望率先跑通,出海或将成为重要方向 [11][69] - 精细操作能力有待提升,灵巧手的耐久度、灵活度、力度控制是从演示走向实用的另一大难关 [3][11][73] 4. 市场空间超480亿,车企与机器人企业相互配合推动落地 - 预计到2035年,中国工业场景中汽车制造、电子制造、物流仓储三大领域人形机器人总需求量达到48.4万台,市场空间483.6亿元 [4][12][75] - 预计到2030年,总需求量达到7.1万台,市场空间84.7亿元 [12][75] - 特斯拉、小鹏等车企具备技术与场景双重优势,推动人形机器人在工业场景落地 [4][12][80] - 机器人本体企业与车企合作落地,Walker系列、Figure等成为典型代表 [4][12][85][89]