Helix
搜索文档
Videotron Found to Infringe Adeia's Media Patents
Globenewswire· 2025-10-30 04:35
SAN JOSE, Calif., Oct. 29, 2025 (GLOBE NEWSWIRE) -- Adeia Inc. (Nasdaq: ADEA), the company whose innovations shape the way the world explores and experiences entertainment, today announced that the Federal Court of Canada has issued a favorable judgment in its patent infringement litigation against Videotron Ltd. On October 24, 2025, the Honorable Madam Justice Gagné awarded Adeia a permanent injunction, finding that Videotron’s Helix, illico+ and illico video platforms infringe an Adeia media patent. The F ...
机械设备行业专题研究:机器人大脑是商业化焦点,Sim2real或成主流训练方案
国盛证券· 2025-10-26 17:06
行业投资评级 - 增持(维持)[4] 核心观点 - 机器人大脑是商业化焦点,Sim2real或成主流训练方案 [1] - 从LLM到VLA再到世界模型,人形机器人“大脑”发展迅猛,模型性能逐步提高 [1][9] - Tesla Optimus等海外模型拟人化程度高,国内研究机构在算法和数据集方面取得不错进展 [3] 机器人大脑模型技术演进 - LLM基于大规模文本数据训练的Transformer架构,解决了文本理解问题但无法处理图像 [9] - VLM跨模态融合突破文本限制,可同时识别图像和文本,由视觉编码器和语言模型组成 [12] - VLA模型跨越了图像/文本感知与机器人动作之间的鸿沟,RT-2是全球首个VLA模型,极大提升了泛化能力但数据收集成本较高 [1][17] - 模型输入端从视觉扩展到触觉,提升了鲁棒性 [1] - ViLLA框架采用无标注视频训练,解决了机器人动作不符合物理学的问题 [22] - 机器人模型终局形态或为世界模型,如Gemini Robotics 1.5系列已具备思维能力,可将AI世界带入物理世界 [26][28] 主流训练方案与发展 - Sim2Real或为未来主流训练方式,通过合成数据生成技术让机器人积累经验,使用虚拟数据为主、真实数据为辅 [2] - Sim2Real技术核心是串联AI超级计算机、仿真计算机(Omniverse和Isaac Sim)和物理AI计算机(GROOT、Cosmos、Jetson Thor)三台计算机 [2] - 银河通用发布的DexonomySim开源合成数据集即采用虚拟与真实数据合成 [2] 重点公司/机构模型分析 - Tesla Optimus的AI系统高度借鉴FSD技术,采用纯视觉方案和端到端单一神经网络,并与xAI的Grok模型深度融合,拟人化程度高 [29][30][33] - Tesla从模仿学习转向视频学习,下一步大模型架构方向或为世界模型 [36] - 北京通用人工智能研究院提出全球首个“力位混合控制算法”统一理论,无需使用传感器,相关任务成功率较仅使用位置控制策略提高约39.5% [3][58] - 银河通用发布全球首个灵巧手功能性抓取合成大数据集DexonomySim [3] - 智元启元大模型(GO-1)采用ViLLA架构,由VLM和MoE组成,可结合互联网视频和人类示范进行学习 [40] - Figure AI的Helix模型采用“系统1”(200Hz高速执行)与“系统2”(7-9Hz语义推理)双层解耦架构,可通过语言指定获取新技能 [46][48] - 宇树科技推出的UnifoLM-WMA-0是世界模型-动作架构,核心是理解机器人与环境交互物理规律的世界模型 [51]
开源证券:Figure03震撼发布 人形机器人板块迎来“燃点时刻”
智通财经网· 2025-10-15 20:46
产品发布与核心特性 - Figure发布新一代人形机器人Figure03,是首款从设计源头即为大规模制造打造的机型[1] - Figure03首次将设计重心延伸至家庭场景,采用软质织物包覆与轻量化结构,提升人机共处的安全性与舒适感[1] - 灵巧手集成视触觉传感器,可在视线受限环境下实现稳定操作,并支持足底无线充电,实现近乎无缝的自主续航[1] 技术迭代与生态构建 - 公司自2022年5月成立以来,在12个月内完成初代机设计,24个月推出工业版Figure02,并于2025年10月推出面向量产的Figure03[2] - 公司与宝马开展工厂场景测试,与Brookfield共同建设全球最大人形机器人数据集,有望借助Brookfield收集超10万户家庭真实数据[2] - 公司2025年C轮估值达390亿美元,投资方包括英伟达、英特尔、高通、微软、亚马逊等科技巨头[2] 估值体系与市场空间 - 根据Figure规划,四年内出货超10万台,对应估值近400亿美元[2] - 参考特斯拉Optimus机器人目标交付100万台,预计带来约5000亿美元新增市值,单台估值密度为40-50万美元/台[2] - 若国内头部机器人公司未来三年内实现出货10万台,有望对应3000亿元人民币市值空间[2] 软件与硬件协同体系 - Figure03硬件架构为自研大模型Helix量身设计,Helix实现从视觉感知到动作控制的端到端推理,展现出快速泛化能力[3] - 灵巧手在掌心集成摄像头,自研柔性指尖传感器可感知3克压力,实现对薄、脆弱、不规则物体的稳定抓取[3] - 足底支持2kW无线充电,配合10Gbps毫米波数据回传,实现了"边充边学"的连续作业[3] 量产策略与产能规划 - Figure03生产工艺从高成本CNC加工转向压铸、注塑和冲压等模具化工艺[4] - 公司自建BotQ智能工厂,计划首条产线年产能1.2万台,规划四年内总产能达10万台[4] 供应链合作与受益标的 - Figure采用"自研+外部配套"供应链模式,并与多家国内厂商建立了长期合作关系[5][6] - 以量产为导向,Figure与特斯拉等头部机器人的技术路径和部分供应链将走向趋同,对中国硬件供应链的依赖程度或将加深[6] - 具备工程化量产能力、成本控制优势、和全球化产能布局能力的供应商有望深度受益[1][6]
Figure 03震撼发布,人形机器人的“燃点时刻” | 投研报告
中国能源网· 2025-10-15 15:12
核心观点 - 人形机器人行业正逐步形成新的估值体系,以Figure和特斯拉为代表的公司规划大规模出货,对应巨大的市值增长潜力 [1][2] - Figure03的发布标志着行业进入“燃点时刻”,其从设计源头聚焦大规模制造和家庭场景应用,实现了技术、生态和资本的跨越式发展 [2] - 以自研大模型Helix为核心的软硬件协同体系是实现快速场景泛化和复杂任务执行的关键,硬件在灵巧手、无线充电和量产工艺上取得关键升级 [3][4] - 中国供应链凭借工程化量产能力、成本优势和全球产能布局,有望深度融入全球头部机器人公司的量产链条并受益 [5] 技术迭代与产品特性 - Figure03是首款为大规模制造打造并首次将设计重心延伸至家庭场景的人形机器人,采用软质织物包覆与轻量化结构以提升安全性与舒适感 [2] - 灵巧手集成视触觉传感器,掌心集成摄像头可在视线受限环境下获取近距图像,自研柔性指尖传感器可感知3克压力,实现对薄、脆弱物体的稳定抓取 [2][3] - 支持足底2kW无线充电,配合10Gbps毫米波数据回传,实现近乎无缝的自主续航和“边充边学”的连续作业,通过集成化设计提升整机续航与可靠性 [2][3][4] - Figure03生产工艺从高成本CNC加工转向压铸、注塑和冲压等模具化工艺,自建BotQ智能工厂计划首条产线年产能1.2万台 [4] 生态合作与场景应用 - 公司与宝马开展工厂场景测试,与Brookfield共同建设全球最大人形机器人数据集,有望借助后者收集超10万户家庭真实数据,完善“场景-数据”闭环 [2] - 自研大模型Helix实现从视觉感知到动作控制的端到端推理,在不到一年内从汽车工厂扩展至物流分拣与家庭家务等多场景,展现出快速泛化能力 [3] 资本表现与估值逻辑 - 公司2025年C轮估值达390亿美元,投资方包括英伟达、英特尔、高通、微软、亚马逊等科技巨头 [1][2] - 根据公司规划,四年内出货超10万台,对应估值近400亿美元,参考单台估值密度40-50万美元/台 [2] - 特斯拉Optimus机器人目标交付100万台,预计带来约5000亿美元新增市值,若国内头部机器人公司未来三年内实现出货10万台,有望对应3000亿元人民币市值空间 [2] 供应链影响 - 公司采用“自研+外部配套”供应链模式,在执行器、电池、传感器等关键模块采用自主设计及垂直整合,与多家国内厂商建立了长期合作关系 [5] - 以量产为导向,Figure与特斯拉等头部机器人的技术路径和部分供应链将走向趋同,对中国硬件供应链的依赖程度或将加深 [5]
行业点评报告:Figure03震撼发布,人形机器人的“燃点时刻”
开源证券· 2025-10-15 09:47
行业投资评级 - 投资评级:看好(维持)[1] 核心观点 - Figure 03的发布标志着人形机器人产业正式迈入规模化应用阶段,是行业的“燃点时刻”[5][14] - 行业正逐步形成新的估值体系,参考海外市场逻辑,若国内头部机器人企业未来三年实现出货10万台,有望对应3000亿元人民币市值空间[5][23] - 以量产为导向,Figure与特斯拉等头部企业的技术路径和部分供应链将走向趋同,具备相关能力的中国硬件供应商有望深度受益[7][39] Figure 03 产品分析 - Figure 03是首款从设计源头即为大规模制造打造的机型,首次将设计重心延伸至家庭场景[5][14] - 产品关键升级包括:采用软质织物包覆与轻量化结构,重量较Figure 02减轻9%;灵巧手集成视触觉传感器,可感知3克压力;支持2 kW足底无线充电[6][14][31][32] - 生产工艺从高成本CNC加工转向压铸、注塑等模具化工艺,自建BotQ智能工厂计划首条产线年产能1.2万台,规划四年内总产能达10万台[6][35][37] 公司发展历程与生态构建 - Figure自2022年5月成立以来,三年内实现技术快速迭代:12个月内完成初代机设计,24个月推出工业版Figure 02,2025年2月发布自研大模型Helix,同年10月推出Figure 03[5][18] - 生态合作方面,与宝马开展工厂场景测试;与Brookfield合作建设全球最大人形机器人数据集,有望收集超10万户家庭真实数据[5][18] - 资本层面,2025年C轮融资后估值达390亿美元,投资方包括英伟达、英特尔、微软、亚马逊等科技巨头[5][21] 技术体系:Helix与软硬件协同 - Helix作为机器人大脑,是实现从视觉感知到动作控制端到端推理的自研大模型,展现出快速泛化与环境自适应能力[6][26] - 硬件为Helix量身设计,最大化其视觉—语言—运动一体化学习与控制能力,实现“软件定义硬件”[6] - 灵巧手的视触觉方案是Figure和特斯拉共同的技术选择,被视为人形机器人实用化的核心[6][31] 投资建议与标的 - 推荐标的:灵巧手领域推荐震裕科技,视触觉传感器领域推荐隆盛科技[8][41] - 受益标的:模组及结构件领域关注领益智造、长盈精密、蓝思科技、银轮股份;灵巧手领域关注东睦股份;表面包覆材料领域关注恒辉安防[8][41]
刚刚,Figure 03惊天登场,四年狂造10万台,人类保姆集体失业
36氪· 2025-10-10 18:50
产品发布与定位 - Figure 03正式亮相,开启通用机器人规模化时代,专为Helix AI大脑、家庭使用及全球规模化应用而设计[1][3] - 产品是公司首款从零设计为大规模制造的机器人,目标在家庭与商业场景间无缝切换,例如物流搬运、工厂工作、配送快递等[21][22] - 公司CEO Brett Adcock表示未来每个家庭都将拥有一个人形机器人,该产品登上TIME杂志封面[6] 硬件设计与性能提升 - 全机采用柔性织物外层取代机械外壳,质量比Figure 02减轻9%,体积显著缩小,关键位置使用多密度泡沫防夹伤,提升家庭环境安全性[3][8][19] - 手部系统实现质的飞跃,每个指尖可感知低至3克的压力,能区分稳固握持与即将滑脱,可细腻操作如拾取鸡蛋或掀起扑克牌[16][17][20] - 执行器速度提升2倍,扭矩密度优化,支持更快搬取与操作[21] - 支持10 Gbps毫米波数据卸载,允许整个机器人舰队上传TB级数据用于持续学习与改进[18] 感知与交互系统 - 视觉系统帧率提升一倍,延迟降低至四分之一,视野角度扩大60%,结合更广景深,提供密集稳定感知数据流[11][12] - 每只手掌心集成广角低延迟摄像头,即使主摄像头被遮挡也能保持持续视觉感知,确保实时自适应控制[11][15] - 升级音频系统,扬声器体积翻倍,功率提升近四倍,麦克风位置优化,语音识别更清晰、交互更自然[24] 量产与商业化路径 - 公司创立BotQ高产能制造工厂,首期年产能12,000台,目标四年内累计生产100,000台[8][22][25] - 通过设计与流程革新、建立全新供应链、创立大批量制造工厂三大举措实现量产目标[25] - 产品配备无线感应充电,脚部内置充电线圈,踩上充电底座即可实现2kW功率快速充电[24]
可用来做家务,海外机器人龙头发布新品,国内公司也有重要进展
选股宝· 2025-10-10 08:24
产品技术进展 - 人形机器人头部企业Figure发布新一代产品Figure 03,其视觉系统经过工程优化,实现帧率翻倍、延迟降低至四分之一、单个摄像头视场角提升60%且体积更紧凑 [1] - 新的视觉架构结合扩展景深,为机器人提供更密集稳定的感知流,是其在复杂环境中实现智能导航与精细操作的关键 [1] - Figure 03手部设计在顺应性与触觉方面实现突破,更柔软具适应性的指尖增大了接触面积,使其能稳定抓取各种形状与尺寸的物体 [1] 行业趋势与展望 - 近期海外龙头与国内龙头企业都提出了量产的展望,且行业内多次出现亿元级别的大订单 [1] - 人形机器人板块正在进入量产前夕,明年的量产阶段或将出现国内和海外的产业共振 [1] 公司合作与业务动态 - A股公司赛力斯下属子公司重庆凤凰技术与北京火山引擎签署《具身智能业务合作框架协议》 [1] - 长盈精密表示已经与AI Figure和北美人形机器人头部企业建立了合作关系 [2] - 绿的谐波表示一直密切关注行业前沿技术包括美国Figure机器人公司,目前正大力推进行星滚柱丝杠在非机器人行业应用场景的研发探索 [2]
Figure 03发布 这些上市公司相关
上海证券报· 2025-10-10 07:55
产品创新 - 搭载专为Helix系统设计的新一代感知系统与手部系统 [3] - 新一代视觉系统实现帧率翻倍、延迟降低至四分之一、单个摄像头视场角提升60% [3] - 手掌内嵌入广角低延迟摄像头,为抓取提供近距离视觉反馈 [3] - 手部设计在顺应性与触觉方面实现突破,指尖更柔软以增大接触面积,稳定抓取多样物体 [3] - 自研首代触觉传感器以解决现有方案应用限制 [3] 设计优化与量产准备 - 机体采用多密度泡棉防夹设计,外层覆盖柔性织物,相比Figure 02重量减少9% [4] - 柔性外层可完全拆洗且无需工具更换,支持定制耐割耐磨等材质服饰 [4] - 支持无线感应充电与无线数据传输,脚部内置充电线圈支持2kW功率感应充电 [4] - 通过压铸、注塑与冲压等模具化工艺大幅减少零件数量与装配步骤,降低单台制造成本 [4] - 对关键模块实行垂直整合自主设计制造,并建立全球供应商网络支持百万级零部件生产目标 [4] 生产能力与市场应用 - 专用制造工厂BotQ首期产线每年可生产最高12000台机器人,计划未来四年累计生产10万台 [5] - Figure 03适用于家庭及商业场景,驱动器性能翻倍、速度提高两倍,扭矩密度显著提升 [5] - 视觉与触觉系统升级使其能在商业环境中实现智能导航与精确操作 [5] 产业链相关公司 - 长盈精密为Figure提供人形机器人零组件 [5] - 宏润建设参股战略投资矩阵超智,产品对标Figure,双方将成立合资公司专注于人形机器人研发、生产和商业化应用 [5] - 矩阵超智于今年7月发布Matrix-1人形机器人,已有产品落地和订单,产品对标北美头部公司三代机 [6]
Figure 03发布,这些上市公司相关
上海证券报· 2025-10-10 07:52
10月9日晚,人形机器人领域头部企业Figure宣布发布Figure 03——一款为Helix系统、家庭环境以及大 规模的现实世界而生的产品。 Height ere" Payload 20KG Weight 60KG Runtime 5HB Speed 2M/S System RIC 为了推进量产,Figure几乎重新设计了所有零部件,并大幅减少零件数量、装配步骤及非关键部件。此 外,Figure 03转向了压铸、注塑与冲压等模具化工艺,使得单台制造成本大幅下降,且随产量提升进一 步优化。 最后,为了实现规模化生产,Figure从零建立了完整的供应链体系。公司对关键模块(如驱动器、电 池、传感器、结构件、电子系统)实行垂直整合,全自主设计制造。针对其他部件,Figure精选并合作 符合高质量与高产能标准的全球供应商,形成可共同扩张的合作网络,支持从数千台到百万级零部件的 生产目标。 BotQ是Figure专用的人形机器人制造工厂,旨在实现规模化生产。其首期产线每年可生产最高12000台 机器人,并计划在未来四年内累计生产10万台。 对比前两代机器人,Figure 03展现了多种原创性创新。 首先,Figure ...
盘点下国内外那些做具身感知的公司们!
具身智能之心· 2025-10-08 10:49
文章核心观点 - 具身智能已成为全球新焦点 打造通用本体和大脑是创业公司、资本和产业界高度关注的突破方向[2] - 文章旨在全面梳理具身大脑领域国内外知名公司 分析其技术特点、产品布局和应用场景 为行业提供全景图[2] - 重点关注开发机器人"大脑"系统的企业 包括具身大模型、多模态感知决策系统等[3] 国内公司分析 自变量机器人 - 公司成立于2023年 聚焦"通用具身大模型"研发 以真实世界数据为主要来源构建具备精细操作能力的通用机器人[6] - 技术路线偏向"大脑" 坚持走端到端的具身通用大模型路线 成立不到两年已完成8轮融资[6] - 代表成果包括2024年10月推出的WALL-A模型 为全球目前最大参数规模的具身智能通用操作大模型Great Wall系列成员 能整合视觉、语言与运动控制信号实现感知到执行完整闭环[6] - 另一成果为开源具身智能基础模型Wall-OSS 具备强大泛化性和推理能力[6] 星海图 - 公司于2023年9月成立 专注于提供智能导航等大脑相关技术方案 坚持"一脑多形"理念[6] - 通过构建环境地图、路径规划等功能 为机器人在复杂环境中自主行动提供支持[6] - 代表成果为具身基础模型EFM-1 采用"快-慢双系统"模型架构 实现从感知理解到控制的闭环决策[6] 优必选 - 公司成立于2012年 是全球人形机器人商业化领导者 拥有全栈自研能力包括运动控制、关节模组、AI-Embodied系统等[10] - 作为国内人形机器人领域标杆企业 已在全球市场建立广泛品牌影响力和市场份额[10] - 代表成果为2025年自主研发的百亿参数基座多模态大模型Thinker 在机器人感知与规划领域三大国际权威基准测试中斩获四项全球第一[10] - 技术成果包括3D扩散策略DP3 仅需10次人类演示即可让机器人学会复杂操作任务 真实场景成功率高达85%[10] - 空间智能引擎RSR为全球首个real2sim2real引擎 实现低成本三维环境重建与仿真训练[10] 智元机器人 - 公司成立于2023年2月 聚焦AI与机器人深度融合 致力于打造世界级领先的通用具身智能机器人产品及应用生态[10] - 代表成果为2025年3月发布的智元启元大模型 基于Vision-Language-Latent-Action架构 融合多模态大模型与混合专家技术[10] - 该模型具有小样本快速泛化能力 任务成功率较市面模型提升32% 支持"一脑多形"的跨本体应用[10] - "具身智脑"分层系统包括云端超脑、大脑、小脑、脑干等部分 形成完整控制体系[10] 银河通用 - 公司成立于2023年5月 为核心技术与产品构建了三大技术壁垒 在合成数据驱动的多模态大模型方面自主研发全球首个"通用具身大模型"[10] - 采用"大脑+小脑"协同框架[10] - 代表成果包括全球首个端到端具身抓取基础大模型GraspVLA 展示无需大规模真实数据、仅通过合成数据达到基础模型预训练的能力[14] - GroceryVLA模型为首款面向零售商业化的端到端大模型 支持复杂零售场景下的精准商品识别与取送[14] - TrackVLA为产品级纯视觉端到端导航大模型 支持自然语言指令驱动 具备零样本泛化能力[14] 千寻智能 - 公司成立于2024年 为国内领先的AI+机器人全栈生产力级技术能力的具身智能公司 团队成员来自顶尖高校和知名企业[14] - 代表成果为Spirit V1 VLA模型 是国内首个攻克柔性物体长程操作难题的AI模型 通过视觉-语言-动作融合实现自然语言指令驱动的复杂任务[14] 星动纪元 - 公司由清华大学交叉信息研究院孵化 研发具身智能以及通用人形机器人技术和产品 聚焦通用人工智能前沿应用[14] - 代表成果为端到端原生机器人大模型ERA-42 是国内首个端到端原生具身大模型 支持机器人完成超过100种动态任务[14] - 该模型通过视频训练快速学习技能 降低数据采集成本 实现跨任务、跨本体迁移[14] 逐际动力 - 公司聚焦具身智能机器人研发与制造 围绕本体硬件设计制造、基于强化学习的全身运动控制、具身大脑训练范式三大核心技术构建具身Agent开发工具链[14] - 代表成果包括LimX VGM具身智能操作算法 利用视频生成技术推动具身大脑突破[14] - LimX DreamActor为全新具身智能训练范式 首次实现Real2Sim2Real、模仿学习和真机强化学习的深度结合[15] 穹彻智能 - 公司聚焦"以力为中心"的具身智能大模型和相关基础设施研发 为不同行业提供通用机器人智能解决方案[18] - 穹彻具身大脑结合先进算法和数据支持 具备指令推理、任务规划、物体分类、环境感知、自主导航等全闭环能力[18] - 代表成果穹彻具身大脑由实体世界大模型和机器人行为大模型组成 Noematrix Brain 2.0新增实体概念学习能力 支持3D模仿学习框架和视-触觉融合网络[18] 智源研究院 - 成立于2018年11月 核心目标是聚焦人工智能原始创新和核心技术 推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破[18] - 代表成果RoboBrain 2.0是新一代具身视觉-语言基础模型 以70亿和320亿参数的两种规格实现感知、推理与规划能力统一[18] 国外公司分析 Figure AI - 公司成立于2022年 总部位于美国硅谷 致力于开发具备人工智能能力的人形机器人以解决劳动力短缺、危险工作环境和老龄化社会等问题[21] - 代表成果Helix为通用视觉-语言-动作模型 采用独特"双系统"AI架构模仿人类"直觉"和"思考"的认知模式[21] Physical Intelligence - 公司成立于2023年1月 为美国具身大脑初创公司 专注于开发能为各类机器人和机器添加高级智能的软件[24] - 目标创建通用机器人系统的人工智能 将用于构建语言模型的技术与控制和指导机器的技术相结合[24] - 代表成果包括2024年10月31日发布的首个机器人通用基础模型π0 以及近期新开源的π0.5模型 后者采用"知识隔离"训练方法提升开放世界场景泛化能力[24] 谷歌DeepMind - 由DeepMind和Google Brain于2023年合并而成 聚焦通用人工智能研究 致力于开发能理解和适应物理世界的智能系统[24] - 代表成果Gemini Robotics基于Gemini 2.0的视觉-语言-动作模型 可直接控制机器人执行复杂任务 具备通用性、交互性和灵巧性[24] - Gemini Robotics-ER专注于具身推理 Project Astra为概念AI助理 集成Gemini技术通过摄像头和传感器理解物理环境[24] 英伟达 - 全球领先图形处理器设计公司 已发展为涵盖芯片设计、系统平台、软件生态、云计算服务、人工智能解决方案的全栈计算公司[24] - 代表成果Eureka系统基于GPT-4打造 可自动训练实体机器人动作指令 支持30余种复杂动作 具备零样本生成、编写代码和语境改进等能力[24] - GR00T N1开源模型采用双系统架构 包括快速反应的"系统1"和认知决策的"系统2" 实现接近人类运动控制能力[25] Skild AI - 美国领先机器人"大脑"研发企业 目标研发通用机器人操作系统 帮助机器人理解不同应用场景并驱动机器人自主实现智能精细化操作[28] - 代表成果Skild Brain通过摄像头图像和关节反馈直接控制机器人动作 采用分层架构适用于各种四足机器人、人形机器人、桌面机械臂、移动机械手等[28] Covariant - 专注于为机器人构建基础AI模型的公司 技术依赖于机器人与现实世界的交互产生的体验和反馈[28] - 代表成果RFM-1为世界上首个基于真实任务数据训练的机器人大模型 是参数80亿的transformer模型 支持任何模态输入、预测任何模态输出[28] 知名团队研究 - Meta和CMU联合打造RoboAgent 核心在于多任务动作分块Transformer架构 通过在现有机器人经验基础上创建多样化语义增强集合来倍增离线数据集[30] - Stanford李飞飞团队VoxPoser核心思想是利用VLM和LLM常识知识 借助模型生成代码将常识知识映射到三维空间供运动规划器使用 实现零样本合成日常操纵任务轨迹[30]