Gemini Robotics
搜索文档
国泰海通|汽车:中国人形机器人公司在CES 2026上表现亮眼
国泰海通证券研究· 2026-01-13 21:20
行业核心观点 - 人形机器人行业已进入商业化初期 需重视行业边际变化对产业链公司的影响 [1] - 近期国内外企业在产业与资本市场持续取得进展 国内外产业有望共振 全球商业化进程有望加速 [2] CES 2026展会表现 - 中国人形机器人企业在CES 2026表现亮眼 展会共有4000多家企业参展 中国参展商占近1/4 人形机器人展区至少有28家中国企业参与 占比过半 [2] - 智元机器人首次在美国完整展示全系列产品线 包括灵犀X2、远征A2、精灵G2等明星产品 [2] - 宇树科技的G1人形机器人在现场上演拳击格斗 [2] - 众擎机器人展示全尺寸通用人形机器人T800 可与观众互动 其明星产品PM01现场演绎多个高难度动作 [2] - 多家海外企业也在CES 2026展示进展 LG推出首款应用于家庭场景的人形机器人CLOiD 可与智能家居协作完成洗衣、倒水等任务 [3] - 波士顿动力首次公开展示全新一代电动Atlas 拥有56个自由度 头部躯干可360度旋转 电池续航4小时 可在3分钟内自主更换电池 展示视频中Atlas可将汽车门板举过头顶进行装配 [3] - 波士顿动力计划与Google DeepMind合作 在未来几个月将Gemini Robotics模型引入Atlas Atlas已与现代汽车合作 计划在2026年进行交付 [3] 产业链公司动态 - 核心零部件供应商新剑传动于1月9日启动上市辅导 中信证券担任辅导机构 [4] - 新剑传动成立于1999年 为C34通用设备制造商 由上海新剑资产管理有限公司持股29.40% [4] - 公司为专精特新“小巨人”企业 专业从事研发生产滚轧成型蜗杆齿轮、座椅水平驱动器、行星滚柱丝杠-直线型电驱动关节、旋转型电驱动关节等产品 [4] - 根据中国证券报 新剑传动是特斯拉人形机器人核心零部件供应商 其产品2022年已应用于特斯拉擎天柱机器人(Optimus) [4]
国泰海通 · 晨报260114|有色金属、汽车
国泰海通证券研究· 2026-01-13 21:20
金属新材料 - 核心观点:部分金属正从普通商品转变为战略资产,宏观预期、供给扰动及战略储备逻辑共同支撑价格,能源金属受政策影响需求可能前置,稀土作为关键战略资源价值凸显 [1][3][4] - 贵金属:地缘政治及美国偏强的失业率数据支撑黄金价格,展望2026年,央行购金和黄金ETF持仓份额上升将继续成为支撑金价的重要因素,白银短期跟随黄金走势,铂金因美国关税预期走强 [2] - 铜:宏观预期向好叠加智利Mantoverde铜矿罢工等供给扰动,铜价震荡偏强,矿端紧缺延续,需求端虽受高价影响,但较低的非美地区库存及美国“门罗主义”回归下的战略储备逻辑将放大价格向上弹性 [3] - 铝:宏观预期强劲、流动性宽松与补涨行情共同推动铝价持续上行,基本面看,供应端日均产量随国内及印尼新投项目爬产而提升,需求端因环保管控解除,铝板带箔开工明显回升,带动下游加工龙头企业开工率微幅上升0.2个百分点至60.1% [3] - 锡:缅甸佤邦矿山复产滞后及印尼RKAB审批节奏不确定限制供应弹性,锡价受流动性宽松预期托底,叠加半导体行业驱动焊料需求,供需偏紧格局延续,价格向上动能充足 [3] - 碳酸锂:上周(1月9日)碳酸锂库存累积,产量上升115吨,需求边际走弱但仍保持较好水平,电池产品出口退税额将下调,预期电池需求或将前置,江西重要矿山复产存在扰动,市场对产量释放存在分歧 [4] - 钴:上游受原料偏紧影响报价偏高,下游采买谨慎,钴业公司多向电新下游延伸,构建钴-镍-前驱体-三元的一体化成本优势以增强竞争壁垒 [4] - 稀土:在政策和春节前备库需求回暖的双重影响下,稀土价格回升,其中中重稀土价格涨幅更为明显,作为关键战略资源的投资价值持续被看好 [4] 汽车(人形机器人) - 核心观点:近期国内外人形机器人企业在产业和资本市场持续取得进展,产业有望共振,全球商业化进程有望加速,中国企业在CES 2026上表现尤为亮眼 [7][9] - 中国人形机器人企业CES表现:CES 2026共有超过4000家企业参展,中国参展商占近1/4,人形机器人展区至少有28家中国企业参与,占比过半,全方位展现技术实力,例如智元机器人首次在美展示全系列产品线,宇树科技G1机器人现场进行拳击格斗,众擎机器人T800能与观众互动 [9] - 海外企业进展:LG推出首款应用于家庭场景的人形机器人CLOiD,现代汽车旗下的波士顿动力首次公开展示全新一代电动Atlas,拥有56个自由度,电池续航4小时,能3分钟内自主更换电池,可执行汽车装配任务,未来将与Google DeepMind合作引入Gemini Robotics模型,并计划在2026年交付 [10] - 产业链公司动态:杭州新剑机电传动股份有限公司(新剑传动)于1月9日启动上市辅导,该公司为专精特新“小巨人”企业,专业从事研发生产滚轧成型蜗杆齿轮、行星滚柱丝杠等产品,是特斯拉人形机器人Optimus的核心零部件供应商,其产品已于2022年应用于Optimus [11]
国泰海通:中国人形机器人公司在CES 2026表现亮眼 全球范围内商业化进程有望加速
智通财经· 2026-01-13 15:05
行业动态与展会表现 - 在CES 2026上,人形机器人行业已进入商业化初期,国内外产业有望实现共振,全球商业化进程有望加速 [1] - CES 2026共有超过4000家企业参展,其中中国参展商占比近1/4,人形机器人展区至少有28家中国企业参与,占比过半 [1] - 中国人形机器人企业在CES 2026上全方位展示技术实力,涵盖从核心部件到整机应用,从功能演示到场景落地 [1] 中国企业具体展示 - 智元机器人在美国首次完整展示全系列产品线,包括灵犀X2、远征A2、精灵G2等明星产品 [1] - 宇树科技的G1人形机器人在现场上演拳击格斗 [1] - 众擎机器人展示全尺寸通用人形机器人T800可与观众互动,其明星产品PM01现场演绎多个高难度动作 [1] 海外企业进展 - LG推出首款应用于家庭场景的人形机器人CLOiD,可与智能家居设备协作完成洗衣、倒水等任务 [2] - 波士顿动力首次公开展示全新一代电动Atlas,拥有56个自由度,头部和躯干可360度旋转,电池续航4小时且能在3分钟内自主更换电池 [2] - 在展示视频中,Atlas可以轻松将汽车门板举过头顶进行装配任务 [2] - 波士顿动力计划与Google DeepMind合作,在未来几个月将Gemini Robotics模型引入Atlas,并计划与现代汽车合作于2026年交付Atlas [2] 产业链公司动态 - 杭州新剑机电传动股份有限公司于1月9日启动上市辅导,中信证券担任辅导机构 [3] - 新剑传动成立于1999年,为通用设备制造商,上海新剑资产管理有限公司持股29.40%,公司是专精特新“小巨人”企业 [3] - 公司专业研发生产滚轧成型蜗杆齿轮、座椅水平驱动器、行星滚柱丝杠-直线型电驱动关节、旋转型电驱动关节等产品 [3] - 根据中国证券报,新剑传动是特斯拉人形机器人Optimus的核心零部件供应商,其产品已于2022年应用于该机器人 [3] - 辅导人员计划于今年4月至5月对公司上市条件进行综合评估,并协助准备上市申请文件 [3]
近十年后谷歌与波士顿动力再「牵手」,这次要为人形机器人注入「灵魂」
机器之心· 2026-01-07 08:49
合作公告与核心目标 - 波士顿动力与谷歌DeepMind在CES 2026上宣布达成全新AI合作伙伴关系,旨在为人形机器人开启新的人工智能时代[1] - 合作计划将谷歌DeepMind的前沿Gemini Robotics AI基础模型与波士顿动力全新的Atlas人形机器人进行深度整合[6] - 合作重点在于赋能人形机器人完成多种工业任务,并有望成为制造业转型的重要推动力,首个重点应用领域是汽车行业[7] 合作背景与互补性 - 波士顿动力计划打造全球能力最强大的人形机器人,需要合作伙伴为其建立全新的视觉-语言-动作模型,而DeepMind在构建可靠、可扩展的模型方面被视为最合适的团队[9] - 波士顿动力在机器人动力学、平衡控制等方面声名远播,但在能感知、推理、学习和决策的机器人“大脑”方面是短板[9] - 谷歌DeepMind近年来在机器人AI基础模型上进展显著,其Gemini Robotics模型旨在赋予机器人感知环境、理解指令、规划行动和与人交互的能力[9] - 此次合作是强强联手:DeepMind为机器人注入“灵魂”和智能,波士顿动力则提供一流的硬件平台[10] 技术整合与行业影响 - 联合研究工作预计将在未来数月内启动,并在两家公司内部同步展开[8] - 观点认为,Gemini Robotics的基础能力与Atlas硬件相结合,代表了前沿模型与物理驱动的融合,将重新定义具身智能的扩展定律,通用智能体是合乎逻辑的结果[12] - 合作描绘了人机共存、共创未来的新纪元愿景[15][16] 历史渊源与市场期待 - 谷歌与波士顿动力并非首次交集,谷歌曾在2013年12月通过并购将波士顿动力收入麾下,但约三年半后将其出售给软银集团[14] - 此次合作被视为技术条件成熟后的回归,谷歌凭借以Gemini为代表的大模型体系重夺AI领先地位,而波士顿动力则完成了新一代Atlas机器人的形态与能力重构[14] - 市场期待看到一场“智能正面对决”,例如由Gemini驱动的Atlas机器人对阵中国阵营的宇树或优必选人形机器人[13]
波士顿动力与谷歌DeepMind建立AI合作关系,AI人工智能ETF(512930)红盘上扬
新浪财经· 2026-01-06 13:40
市场表现 - 截至2026年1月6日13:24,中证人工智能主题指数(930713)上涨0.49% [1] - 指数成分股德赛西威(002920)上涨10.00%,北京君正(300223)上涨8.44%,均胜电子(600699)上涨5.69%,澜起科技(688008)上涨4.83%,中科创达(300496)上涨4.29% [1] - AI人工智能ETF(512930)上涨0.44%,最新价报2.26元 [1] 行业动态与催化剂 - 当地时间1月5日,波士顿动力与谷歌DeepMind宣布建立新的人工智能合作伙伴关系,目标是将Gemini Robotics人工智能基础模型与波士顿动力的新型Atlas人形机器人集成,联合研究工作预计将在未来几个月内启动 [1] - 2026年国际消费电子展(CES)即将开幕,AI有望深度融入各类硬件产品并实现创新突破 [1] - 在端侧AI芯片方面,AMD、英特尔、高通等厂商或将展示性能更强的新品 [1] - 在终端应用上,联想、海信、TCL等企业将呈现AI赋能的个性化智能体、AI画质升级及智能家电解决方案 [1] - AI眼镜、AI耳机等原生创新硬件也有望带来全新的人机交互体验 [1] 产业链关键环节分析 - AI需求持续拉动存储器芯片量价齐升,自2024年起AI与服务器领域的DRAM消耗量大幅增长 [2] - 预计到2026年,AI与服务器领域的DRAM消耗量将占DRAM总产能的66%,并已拓展至LPDDR和图形DRAM领域 [2] - 受供不应求影响,2025年第三季度DRAM价格同比上涨171.8%,第四季度涨势延续 [2] - 三星、SK海力士、美光等厂商甚至暂停DDR5合约报价,市场紧张态势凸显 [2] 指数与产品信息 - AI人工智能ETF(512930)紧密跟踪中证人工智能主题指数 [2] - 中证人工智能主题指数选取50只业务涉及为人工智能提供基础资源、技术以及应用支持的上市公司证券作为指数样本 [2] - 截至2025年12月31日,中证人工智能主题指数前十大权重股分别为中际旭创(300308)、新易盛(300502)、寒武纪(688256)、澜起科技(688008)、中科曙光(603019)、科大讯飞(002230)、海康威视(002415)、豪威集团(603501)、金山办公(688111)、浪潮信息(000977) [2] - 前十大权重股合计占比58.08% [2] - AI人工智能ETF(512930)的场外联接基金包括:平安中证人工智能主题ETF发起式联接A(023384)、平安中证人工智能主题ETF发起式联接C(023385)、平安中证人工智能主题ETF发起式联接E(024610) [3]
哈佛老徐:看懂谷歌,就看懂 AI 的下半场
老徐抓AI趋势· 2025-11-30 16:50
文章核心观点 - 谷歌的AI战略并非跟风,而是基于第一性原理的长期布局,其“慢”是为了最终的“快”,目前正进入后劲爆发阶段 [23] - 看懂谷歌的掌舵人及其多模态融合、AGI终局思维,就能看懂AI下半场的走向 [13][23] - AI目前处于起步阶段而非泡沫期,真实需求远未被满足,未来12个月将出现从“问答”到“完成任务”的关键拐点 [8][16][19] - 谷歌是唯一在AI和量子计算两条核心赛道均保持领先的公司,其长期潜力被严重低估 [22][24] AI行业现状与泡沫争议 - 当前科技拐点每10年左右出现一次,本次是AI,全球公司在AI上的投入今年估计超过1万亿美元 [6] - 从需求端看属于供不应求、投入不足,B端和C端真实需求远未被满足,并非泡沫而是起步阶段 [8] - 谷歌资本开支从4年前的300亿美元/年增至今年超过900亿美元/年,多出部分全部投入AI [6] - 谷歌计划未来6个月算力翻一倍,未来5年算力翻1000倍,表明当前AI应用仅是“训练前的训练” [8][9] 谷歌AI战略的独特性与领先性 - 谷歌采取AI-first战略,围绕AI重构物理基础设施、研究体系、所有产品及组织方式,而非仅做AI业务 [13] - 谷歌坚持多模态融合路线,涵盖聊天、推理、视频、世界模型、机器人等能力,存在1+1>2的乘法效应 [14][16] - 与行业“一招鲜”模型不同,谷歌“全家桶”式布局短期优势不明显,但长期融合后威力巨大 [14][16] - 过去半年谷歌底层能力开始相互增强,AGI雏形显现,未来能跟上其节奏的可能只有马斯克的xAI [16] 未来AI技术演进方向 - 未来12个月AI将出现关键拐点:从“问答机器人”升级为能“完成任务”的智能体 [16] - AI将开始真正影响劳动力市场,完成如分析公司、处理交易、规划旅行等实际任务 [17][19] - 量子计算相当于5年前的AI,是下一次文明级别革命,谷歌在此领域投入巨大且技术路径明确 [22][24] 谷歌的长期布局与竞争优势 - 谷歌掌舵人DeepMind创始人哈萨比斯是工业界最懂AI的领袖之一,强调AGI必须多模态全面发展 [13][14] - 公司不争一时得失,专注AGI、量子计算等终局目标,愿意花长时间铺路以实现爆发式突破 [23] - 在AI模拟人脑、量子计算模拟宇宙两条核心赛道上,谷歌是唯一同时领先的公司 [24]
盘点下国内外那些做具身感知的公司们!
具身智能之心· 2025-10-08 10:49
文章核心观点 - 具身智能已成为全球新焦点 打造通用本体和大脑是创业公司、资本和产业界高度关注的突破方向[2] - 文章旨在全面梳理具身大脑领域国内外知名公司 分析其技术特点、产品布局和应用场景 为行业提供全景图[2] - 重点关注开发机器人"大脑"系统的企业 包括具身大模型、多模态感知决策系统等[3] 国内公司分析 自变量机器人 - 公司成立于2023年 聚焦"通用具身大模型"研发 以真实世界数据为主要来源构建具备精细操作能力的通用机器人[6] - 技术路线偏向"大脑" 坚持走端到端的具身通用大模型路线 成立不到两年已完成8轮融资[6] - 代表成果包括2024年10月推出的WALL-A模型 为全球目前最大参数规模的具身智能通用操作大模型Great Wall系列成员 能整合视觉、语言与运动控制信号实现感知到执行完整闭环[6] - 另一成果为开源具身智能基础模型Wall-OSS 具备强大泛化性和推理能力[6] 星海图 - 公司于2023年9月成立 专注于提供智能导航等大脑相关技术方案 坚持"一脑多形"理念[6] - 通过构建环境地图、路径规划等功能 为机器人在复杂环境中自主行动提供支持[6] - 代表成果为具身基础模型EFM-1 采用"快-慢双系统"模型架构 实现从感知理解到控制的闭环决策[6] 优必选 - 公司成立于2012年 是全球人形机器人商业化领导者 拥有全栈自研能力包括运动控制、关节模组、AI-Embodied系统等[10] - 作为国内人形机器人领域标杆企业 已在全球市场建立广泛品牌影响力和市场份额[10] - 代表成果为2025年自主研发的百亿参数基座多模态大模型Thinker 在机器人感知与规划领域三大国际权威基准测试中斩获四项全球第一[10] - 技术成果包括3D扩散策略DP3 仅需10次人类演示即可让机器人学会复杂操作任务 真实场景成功率高达85%[10] - 空间智能引擎RSR为全球首个real2sim2real引擎 实现低成本三维环境重建与仿真训练[10] 智元机器人 - 公司成立于2023年2月 聚焦AI与机器人深度融合 致力于打造世界级领先的通用具身智能机器人产品及应用生态[10] - 代表成果为2025年3月发布的智元启元大模型 基于Vision-Language-Latent-Action架构 融合多模态大模型与混合专家技术[10] - 该模型具有小样本快速泛化能力 任务成功率较市面模型提升32% 支持"一脑多形"的跨本体应用[10] - "具身智脑"分层系统包括云端超脑、大脑、小脑、脑干等部分 形成完整控制体系[10] 银河通用 - 公司成立于2023年5月 为核心技术与产品构建了三大技术壁垒 在合成数据驱动的多模态大模型方面自主研发全球首个"通用具身大模型"[10] - 采用"大脑+小脑"协同框架[10] - 代表成果包括全球首个端到端具身抓取基础大模型GraspVLA 展示无需大规模真实数据、仅通过合成数据达到基础模型预训练的能力[14] - GroceryVLA模型为首款面向零售商业化的端到端大模型 支持复杂零售场景下的精准商品识别与取送[14] - TrackVLA为产品级纯视觉端到端导航大模型 支持自然语言指令驱动 具备零样本泛化能力[14] 千寻智能 - 公司成立于2024年 为国内领先的AI+机器人全栈生产力级技术能力的具身智能公司 团队成员来自顶尖高校和知名企业[14] - 代表成果为Spirit V1 VLA模型 是国内首个攻克柔性物体长程操作难题的AI模型 通过视觉-语言-动作融合实现自然语言指令驱动的复杂任务[14] 星动纪元 - 公司由清华大学交叉信息研究院孵化 研发具身智能以及通用人形机器人技术和产品 聚焦通用人工智能前沿应用[14] - 代表成果为端到端原生机器人大模型ERA-42 是国内首个端到端原生具身大模型 支持机器人完成超过100种动态任务[14] - 该模型通过视频训练快速学习技能 降低数据采集成本 实现跨任务、跨本体迁移[14] 逐际动力 - 公司聚焦具身智能机器人研发与制造 围绕本体硬件设计制造、基于强化学习的全身运动控制、具身大脑训练范式三大核心技术构建具身Agent开发工具链[14] - 代表成果包括LimX VGM具身智能操作算法 利用视频生成技术推动具身大脑突破[14] - LimX DreamActor为全新具身智能训练范式 首次实现Real2Sim2Real、模仿学习和真机强化学习的深度结合[15] 穹彻智能 - 公司聚焦"以力为中心"的具身智能大模型和相关基础设施研发 为不同行业提供通用机器人智能解决方案[18] - 穹彻具身大脑结合先进算法和数据支持 具备指令推理、任务规划、物体分类、环境感知、自主导航等全闭环能力[18] - 代表成果穹彻具身大脑由实体世界大模型和机器人行为大模型组成 Noematrix Brain 2.0新增实体概念学习能力 支持3D模仿学习框架和视-触觉融合网络[18] 智源研究院 - 成立于2018年11月 核心目标是聚焦人工智能原始创新和核心技术 推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破[18] - 代表成果RoboBrain 2.0是新一代具身视觉-语言基础模型 以70亿和320亿参数的两种规格实现感知、推理与规划能力统一[18] 国外公司分析 Figure AI - 公司成立于2022年 总部位于美国硅谷 致力于开发具备人工智能能力的人形机器人以解决劳动力短缺、危险工作环境和老龄化社会等问题[21] - 代表成果Helix为通用视觉-语言-动作模型 采用独特"双系统"AI架构模仿人类"直觉"和"思考"的认知模式[21] Physical Intelligence - 公司成立于2023年1月 为美国具身大脑初创公司 专注于开发能为各类机器人和机器添加高级智能的软件[24] - 目标创建通用机器人系统的人工智能 将用于构建语言模型的技术与控制和指导机器的技术相结合[24] - 代表成果包括2024年10月31日发布的首个机器人通用基础模型π0 以及近期新开源的π0.5模型 后者采用"知识隔离"训练方法提升开放世界场景泛化能力[24] 谷歌DeepMind - 由DeepMind和Google Brain于2023年合并而成 聚焦通用人工智能研究 致力于开发能理解和适应物理世界的智能系统[24] - 代表成果Gemini Robotics基于Gemini 2.0的视觉-语言-动作模型 可直接控制机器人执行复杂任务 具备通用性、交互性和灵巧性[24] - Gemini Robotics-ER专注于具身推理 Project Astra为概念AI助理 集成Gemini技术通过摄像头和传感器理解物理环境[24] 英伟达 - 全球领先图形处理器设计公司 已发展为涵盖芯片设计、系统平台、软件生态、云计算服务、人工智能解决方案的全栈计算公司[24] - 代表成果Eureka系统基于GPT-4打造 可自动训练实体机器人动作指令 支持30余种复杂动作 具备零样本生成、编写代码和语境改进等能力[24] - GR00T N1开源模型采用双系统架构 包括快速反应的"系统1"和认知决策的"系统2" 实现接近人类运动控制能力[25] Skild AI - 美国领先机器人"大脑"研发企业 目标研发通用机器人操作系统 帮助机器人理解不同应用场景并驱动机器人自主实现智能精细化操作[28] - 代表成果Skild Brain通过摄像头图像和关节反馈直接控制机器人动作 采用分层架构适用于各种四足机器人、人形机器人、桌面机械臂、移动机械手等[28] Covariant - 专注于为机器人构建基础AI模型的公司 技术依赖于机器人与现实世界的交互产生的体验和反馈[28] - 代表成果RFM-1为世界上首个基于真实任务数据训练的机器人大模型 是参数80亿的transformer模型 支持任何模态输入、预测任何模态输出[28] 知名团队研究 - Meta和CMU联合打造RoboAgent 核心在于多任务动作分块Transformer架构 通过在现有机器人经验基础上创建多样化语义增强集合来倍增离线数据集[30] - Stanford李飞飞团队VoxPoser核心思想是利用VLM和LLM常识知识 借助模型生成代码将常识知识映射到三维空间供运动规划器使用 实现零样本合成日常操纵任务轨迹[30]
具身大脑风云榜!盘一盘国内外具身大脑的灵魂人物们...
自动驾驶之心· 2025-09-15 07:33
文章核心观点 - 具身智能已成为全球焦点 国内外公司正积极开发机器人"大脑"系统 包括具身大模型和多模态感知决策系统 [2][3] 国内公司技术布局 - 自变量机器人聚焦通用具身大模型研发 以真实世界数据构建具备精细操作能力的通用机器人 [4] - 星海图成立于2023年 坚持端到端的具身通用大模型路线 成立不到两年完成8轮融资 [5] - 星海图推出WALL-A模型 为全球最大参数规模的具身智能通用操作大模型 能整合视觉 语言与运动控制信号 [5] - 星海图开源具身智能基础模型Wall-OSS 具备强大泛化性和推理能力 [5] - 优必选为全球人形机器人商业化领导者 拥有全栈自研能力包括运动控制和AI-Embodied系统 [6][9] - 优必选Thinker大模型在三大国际权威基准测试中斩获四项全球第一 显著提升机器人感知与规划能力 [9] - 智元机器人聚焦AI与机器人深度融合 推出启元大模型Genie Operator-1 任务成功率较市面模型提升32% [7][9] - 智元机器人建立"具身智脑"分层系统 包括云端超脑 大脑 小脑和脑干 形成完整控制体系 [9] - 银河通用构建三大技术壁垒 自主研发全球首个"通用具身大模型" 采用大脑+小脑协同框架 [8][9] - 银河通用推出GraspVLA模型 全球首个端到端具身抓取基础大模型 仅通过合成数据达到预训练能力 [9][13] - 千寻智能Spirit V1 VLA模型攻克柔性物体长程操作难题 实现自然语言指令驱动的复杂任务 [10][13] - 星动纪元研发端到端原生机器人大模型ERA-42 支持机器人完成超过100种动态任务 [11][13] - 逐际动力聚焦具身智能机器人研发 构建具身Agent开发工具链 推动多领域应用 [12][13] - 穹彻智能聚焦以力为中心的具身智能大模型 其Noematrix Brain 2.0新增实体概念学习能力 [14][16] - 智源研究院推出RoboBrain 2.0 以70亿和320亿参数实现感知 推理与规划能力统一 [15][16] 国外公司技术进展 - Figure AI致力于开发具备AI能力的人形机器人 解决劳动力短缺等问题 [17] - Figure AI推出Helix模型 采用独特双系统AI架构模仿人类直觉和思考的认知模式 [17] - Physical Intelligence专注于为机器添加高级智能 发布机器人基础模型π0和π0.5 [18][21] - 谷歌DeepMind推出Gemini Robotics模型 可直接控制机器人执行复杂任务 [19][21] - 谷歌DeepMind开发Gemini Robotics-ER 增强机器人对空间和物理世界的理解能力 [21] - 英伟达Eureka系统基于GPT-4打造 支持机器人实现30余种复杂动作 [20][25] - 英伟达GR00T N1开源模型采用双系统架构 实现接近人类的运动控制能力 [25] - Skild AI研发通用机器人操作系统Skild Brain 通过摄像头图像直接控制机器人动作 [22][25] - Covariant构建RFM-1模型 为世界上首个基于真实任务数据训练的80亿参数机器人大模型 [23][25] 知名研究团队成果 - Meta和CMU联合打造RoboAgent 采用多任务动作分块Transformer架构 [24][25] - 斯坦福李飞飞团队开发VoxPoser 利用VLM和LLM常识知识实现零样本机器人操纵 [24][25]
国内外那些做具身大脑的公司们......
具身智能之心· 2025-09-13 12:03
文章核心观点 - 具身智能已成为全球焦点 重点关注开发机器人"大脑"系统的企业 包括具身大模型和多模态感知决策系统 [2][3] 国内公司技术布局 - 自变量机器人聚焦通用具身大模型研发 采用端到端技术路线 成立不到两年完成8轮融资 [4][6] - 星海图专注于智能导航技术 坚持"一脑多形"理念 开发具身基础模型EFM-1采用快-慢双系统架构 [5][6] - 优必选拥有全栈自研能力 Thinker大模型在三大国际权威基准测试中斩获四项全球第一 [7][10] - 智元机器人发布启元大模型 采用VILLA架构 任务成功率较市面模型提升32% 支持跨本体应用 [8][10] - 银河通用构建三大技术壁垒 自主研发全球首个通用具身大模型 采用大脑+小脑协同框架 [9][10] - 千寻智能开发Spirit V1 VLA模型 国内首个攻克柔性物体长程操作难题的AI模型 [11][14] - 星动纪元研发端到端原生机器人大模型ERA-42 支持机器人完成超过100种动态任务 [12][14] - 逐际动力聚焦本体硬件设计制造 基于强化学习的全身运动控制和具身大脑训练范式 [13][14] - 穹彻智能开发Noematrix Brain 2.0 新增实体概念学习能力 支持3D模仿学习框架和视-触觉融合网络 [15][17] - 智源研究院推出RoboBrain 2.0 以70亿和320亿参数规格实现感知 推理与规划能力统一 [16][17] 国外公司技术突破 - Figure AI开发Helix模型 采用独特双系统AI架构模仿人类直觉和思考认知模式 [18] - Physical Intelligence发布π0通用机器人基础模型 采用预训练+后训练模式 π0.5采用知识隔离训练方法提升泛化能力 [19][22] - 谷歌DeepMind推出Gemini Robotics系列 具备通用性 交互性和灵巧性 Project Astra体现具身智能在人机交互应用 [20][22] - 英伟达开发Eureka系统基于GPT-4打造 支持30余种复杂动作 GR00T N1采用双系统架构实现接近人类运动控制能力 [21][26] - Skild AI研发Skild Brain分层架构 适用于各种四足机器人 人形机器人和移动机械手 [23][26] - Covariant开发RFM-1模型 参数80亿 是世界首个基于真实任务数据训练的机器人大模型 [24][26] 知名研究团队贡献 - Meta和CMU联合打造RoboAgent 采用多任务动作分块Transformer架构恢复高性能策略 [25][26] - 斯坦福李飞飞团队开发VoxPoser 利用VLM和LLM常识知识实现零样本机器人操纵 [25][26]
谷歌创始人:不看好人形机器人,硬件很炫酷,但软件是短板
Robot猎场备忘录· 2025-06-05 13:37
谷歌联合创始人谢尔盖·布林对人形机器人的观点 - 机器人硬件炫酷但软件系统存在短板 目前离真正实用仍有距离 [1] - 不看好人形机器人形态 认为执着于人形可能低估AI的适应能力 [1][2] - 认为AI可通过仿真模拟快速适应环境 不一定要拥有人类数量肢体才能有效工作 [2] - 曾表示机器人技术虽神奇但未达日常使用水平 看不到具体前景 [2] 具身智能赛道主要参与者 - 特斯拉是人形机器人赛道引领者 Optimus是行业标杆 [3] - 英伟达从芯片和中间件层面入局 打造底层开发生态 [3] - 谷歌Deepmind是具身智能大模型研究引领者 最早布局大模型 [3] - 谷歌2017年提出Transformer架构 成为大语言模型底层基座 [3] - 谷歌模型从Saycan迭代到RT-H 在软件层面步步为营 [3] 谷歌DeepMind最新机器人模型进展 - 2025年3月推出基于Gemini 2.0的两个机器人模型 [5] - VLA模型Gemini Robotics可让机器人理解执行新任务 [5] - VL模型Gemini Robotics-ER增强对物理世界理解 特别是空间推理 [5] - 已与Apptronik、Agile Robots、Boston Dynamics等展开合作 [8] - 依托Gemini多模态世界理解能力 加入物理行动新模态 [9] 人形机器人行业现状与问题 - 炫技视频多为预设动作序列 依赖遥控器和预先编程 [10][11] - 国内企业陷入"炫技"死循环 展示功夫、空翻等与商业化关联不大 [11][13] - 运动能力展示收效佳但实际技术未达生产力时代要求 [10][11] - 国内发展乱象包括重"运动"轻"大脑" 商业化路径不清晰 [11][15] - 部分企业通过ToG和ToB展示场景实现现金流 但持续价值存疑 [15][16] 人形机器人技术发展方向 - 需要实现四个可达:移动、操作、语义、价值和智慧 [11] - 关键突破在于手眼脑协调 才能赋能千行百业 [10] - Gemini Robotics模型特点包括通用性、交互性、灵巧性等 [12] - 采用云端与本地端结合方式 主干网络在云端 Action decoder在机器人芯片 [12] 行业资本与商业化现状 - 赛道受资本和政策扶持 但出现"揠苗助长"趋势 [16] - 商业化核心在于创造持续价值 而非研究或展示需求 [15] - 技术突破和场景探索是关键 但"大脑"突破仍道阻且长 [16] - 部分企业凭借低价策略和营销迅速出圈 但面临流量反噬风险 [15][24]