Gemini Robotics

搜索文档

Robot猎场备忘录· 2025-06-05 13:37

谷歌联合创始人谢尔盖·布林对人形机器人的观点 - 机器人硬件炫酷但软件系统存在短板目前离真正实用仍有距离 [1] - 不看好人形机器人形态认为执着于人形可能低估AI的适应能力 [1][2] - 认为AI可通过仿真模拟快速适应环境不一定要拥有人类数量肢体才能有效工作 [2] - 曾表示机器人技术虽神奇但未达日常使用水平看不到具体前景 [2] 具身智能赛道主要参与者 - 特斯拉是人形机器人赛道引领者 Optimus是行业标杆 [3] - 英伟达从芯片和中间件层面入局打造底层开发生态 [3] - 谷歌Deepmind是具身智能大模型研究引领者最早布局大模型 [3] - 谷歌2017年提出Transformer架构成为大语言模型底层基座 [3] - 谷歌模型从Saycan迭代到RT-H 在软件层面步步为营 [3] 谷歌DeepMind最新机器人模型进展 - 2025年3月推出基于Gemini 2.0的两个机器人模型 [5] - VLA模型Gemini Robotics可让机器人理解执行新任务 [5] - VL模型Gemini Robotics-ER增强对物理世界理解特别是空间推理 [5] - 已与Apptronik、Agile Robots、Boston Dynamics等展开合作 [8] - 依托Gemini多模态世界理解能力加入物理行动新模态 [9] 人形机器人行业现状与问题 - 炫技视频多为预设动作序列依赖遥控器和预先编程 [10][11] - 国内企业陷入"炫技"死循环展示功夫、空翻等与商业化关联不大 [11][13] - 运动能力展示收效佳但实际技术未达生产力时代要求 [10][11] - 国内发展乱象包括重"运动"轻"大脑" 商业化路径不清晰 [11][15] - 部分企业通过ToG和ToB展示场景实现现金流但持续价值存疑 [15][16] 人形机器人技术发展方向 - 需要实现四个可达：移动、操作、语义、价值和智慧 [11] - 关键突破在于手眼脑协调才能赋能千行百业 [10] - Gemini Robotics模型特点包括通用性、交互性、灵巧性等 [12] - 采用云端与本地端结合方式主干网络在云端 Action decoder在机器人芯片 [12] 行业资本与商业化现状 - 赛道受资本和政策扶持但出现"揠苗助长"趋势 [16] - 商业化核心在于创造持续价值而非研究或展示需求 [15] - 技术突破和场景探索是关键但"大脑"突破仍道阻且长 [16] - 部分企业凭借低价策略和营销迅速出圈但面临流量反噬风险 [15][24]

具身智能

CB Insights预测：人形机器人市场规模预计一年翻番 | Jinqiu Select

锦秋集· 2025-05-21 21:04

人形机器人市场概况 - 2024年人形机器人市场融资金额创下12亿美元纪录，预计2025年将达到23亿美元规模，一年内翻倍增长[1] - 工业类人形机器人2024年融资额飙升至9.04亿美元，交易量达40笔峰值，2025年迄今12笔交易吸金6.44亿美元，单笔规模显著扩大[2][5] - 前十大企业融资合计近72亿美元，Meta、小米、优必选、特斯拉四家上市公司吸走近60%资金，私募领域Figure以8.54亿美元融资规模突出[2][11][12] 融资与估值趋势 - Figure和Skild AI成立不足3年估值分别达27亿和15亿美元，Apptronik在A轮融得4.03亿美元[2][18] - Figure的27亿美元估值已超过2024年独角兽公司16亿美元中位估值，市场传言其计划以395亿美元估值进行新一轮15亿美元融资[19][20] - 过去15年工业类人机器人领域典型退出案例仅10起，估值跨度从Addverb的2.44亿美元到优必选的48亿美元[10] 技术发展路径 - Physical AI突破重新定义硬件与软件的杠杆，多模态感知、语言理解与运动控制融合推动估值飙升[2][18] - 产业路线出现"开源协同"和"封闭垂直"两极分化，Boston Dynamics等开放模型快速迭代，Figure、Tesla选择软硬深度耦合[2][34] - 基础模型在复杂物理推理方面仍有局限，需要大量计算资源和训练数据，大公司依靠AI基础设施获得优势[47] 商业化应用 - 企业部署场景从"替代人工"转向"嵌入式协同"，BMW、奔驰、Amazon等已在实际场景中应用[2][36][38] - 中美竞争格局清晰，美国占32%企业数量依托芯片优势，中国厂商以1.37万-2.75万美元超低定价撬开市场[23][25][31] - Figure与Agility Robotics建设年产万台级工厂，Tesla计划年产数百万台Optimus机器人，售价2万美元以下[26] 科技巨头布局 - Google推出Gemini Robotics强调通用性、交互性与灵巧度，Nvidia用Isaac GR00T映射自然语言到机器人操作[2][41][42] - 三星收购Rainbow Robotics，现代并购Boston Dynamics，苹果、Meta保密式研发，科技公司通过"基础模型+并购+内部孵化"三管齐下[2][41] - 百度、华为、Meta、微软开发Physical AI基础模型，Nvidia在基础模型领域领先[41]

谷歌VS Figure AI VS成都：人形机器人的“脑”力角逐

机器人大讲堂· 2025-04-22 16:28

全球人形机器人产业技术革命 - 全球人形机器人产业正迎来"大脑"技术革命，2025年初美国Figure AI、谷歌DeepMind和成都人形机器人创新中心先后发布通用具身智能大模型，争夺产业标准话语权 [1] 谷歌DeepMind技术路径 - 谷歌DeepMind发布基于Gemini 2.0的机器人AI模型Gemini Robotics和Gemini Robotics-ER，目标构建通用机器人生态 [1] - Gemini Robotics在泛化性、交互性和灵巧性三方面提升：泛化能力比现有模型提高一倍，能处理训练中未遇到的任务；语言理解能力优秀，可实时调整路径；能精确操作复杂多步骤任务 [1][3] - Gemini Robotics-ER专注于增强空间推理能力，如识别咖啡杯把位置并规划安全接近路径 [5] Figure AI技术路径 - Figure AI发布Helix端到端视觉-语言-动作通用控制模型，泛化能力、动作精度与实时性显著提升，已在宝马工厂试点 [5] - Helix采用"系统1+系统2"双系统架构：S2解析指令并规划任务目标，S1以毫秒级响应生成动作；具备跨物体泛化能力，可直接部署在低性能芯片上；支持多机器人协作，共享神经网络权重和实时环境感知数据 [5][7] 成都创新中心技术路径 - 成都人形机器人创新中心发布Raydiculous—1系统，国内首个基于3DSGs的自主跨空间任务规划推理执行系统，突破单一场景限制 [9] - Raydiculous—1具有跨场景、长视野、轻量型特点：通过3DSGs实现跨空间连续任务执行；采用长视野任务规划引擎分解复杂任务；模块化设计降低算力需求，硬件成本仅为同类方案1/3 [10][12][15] 技术路径对比 - 谷歌依赖云端算力打造通用机器人生态，Figure AI专注工业场景实时响应，成都方案侧重家庭服务等民生领域轻量化本地部署 [16] - 核心差异：算力需求方面谷歌需千卡集群而成都成本优势显著；联网需求方面谷歌需联网而Figure与成都减少云端依赖；规划能力方面成都具备长视野跨空间优势 [17] - 三家均采用"规划-执行"分层策略，致力于提升机器人日常事务与家务劳动能力 [17] 产业竞争格局 - 人形机器人"大脑"技术是算法竞赛与国家高端制造能力的试金石，中国通过根技术创新可能绕开欧美技术霸权开辟万亿美元级市场 [18] - 产业生态涉及工业机器人、服务与特种机器人、医疗机器人、人形机器人及核心零部件企业 [23][24][25]

研报 | 英伟达发布开源Isaac GR00T N1，预计2028年全球人形机器人市场产值达40亿美元

TrendForce集邦· 2025-03-19 16:41

文章核心观点英伟达GTC 2025发表的Isaac GR00T N1通用人形机器人基础模型有望加速研发进度、缩短产品上市准备期，推升全球人形机器人市场产值于2028年接近40亿美元，且英伟达在人形机器人领域已完整布局产品技术，其建立的生态系将维持封闭，为公司构筑“护城河” [1][4] 分组1：行业趋势 - 英伟达GTC 2025发表的Isaac GR00T N1通用人形机器人基础模型具备完整资料集、多模式输入和开源特性，可加速研发进度、缩短产品上市准备期，预期该领域产品提前放量，2028年全球人形机器人市场产值接近40亿美元 [1] 分组2：模型对比 - Figure AI和Google分别推出的Helix和Gemini Robotics架构与GR00T N1皆整合动作与思考模型提升自主决策能力，但英伟达模型的数据完备度、部署弹性略胜一筹 [2] - 对比GROOT N1、Gemini Robotics、Helix三款模型，在推出厂商、日期、技术架构、功能特点、开源与否、主要应用方面存在差异 [3] 分组3：英伟达布局 - 英伟达创办人黄仁勋看好人形机器人发展，公司已在该领域完整布局产品技术，硬件端有适用于不同类型机器人的嵌入式AI运算系统 [3] - 英伟达Omniverse聚焦训练模拟与数字孪生，多家中国人形机器人大厂搭载其训练平台，加上发表的机器人开源物理引擎、生成合成数据技术及GR00T N1，打造出完整生态圈 [4] 分组4：商业模式 - 尽管GR00T N1开源，但训练参数与硬件配置有一定绑定，使用该模型的开发商预计仍采用英伟达硬件解决方案，其生态系将维持封闭，为公司构筑“护城河” [4]

闯红灯、压线变道…特斯拉FSD入华“水土不服”，消息称正与百度合作解决；机器人能骑自行车了，“稚晖君”新款机器人亮相丨AI周报

创业邦· 2025-03-15 10:42

文章核心观点文章为全球AI产业周报，精选3.8 - 3.14最值得关注的AI新闻和国内外热门AI投融资事件，帮助了解全球AI市场动向[2] 本周AI热点资讯国内大事 - 特斯拉与百度合作提升中国市场ADAS性能，解决FSD“水土不服”问题，百度工程师团队前往特斯拉北京办公室整合地图信息[4][5] - 阿里巴巴推出AI旗舰应用新夸克，升级为“AI超级框”，满足用户各类AI需求[5] - 腾讯向英伟达采购数十亿元规模H20芯片，或为应对微信接入DeepSeek需求[6] - 文远知行开启北京南站Robotaxi商业收费服务，服务范围突破600平方公里[7] - AI视频创企鹿影科技将被MiniMax收购，2024年天使轮融资时估值约1亿人民币[7] - Manus使用申请等候名单达两百万人，与阿里通义千问团队达成战略合作，产品基于阿里千问大模型开发[7][8] - 字节去年曾想3000万美金收购Manus团队，因出价低被拒，目前公司估值接近一亿美元[8] - 周鸿祎称Manus产品体验创新不错，但与DeepSeek成功不是一个数量级[9] - Manus邀请码在闲鱼高价标价，被质疑“饥饿营销”，官方回应是服务器容量有限[9] - Manus官方X账号被冻结后解封，可能与第三方提及加密货币诈骗有关[10] - 00后主播用DeepSeek直播1天卖出3.3亿元，团队用AI整理话术提升效率[10] - 小米汽车1000万Clips版本智驾模型将很快上线[11] - 字节跳动AI大将骆怡航加盟生数科技任CEO[11] - 阿里开源全模态模型R1 - Omni，情感识别能力更优[11] - 智元机器人发布全能探索机器人灵犀X2和首个通用具身基座大模型GO - 1[12][13] - 西湖大学发布具备自我进化能力的智能体AppAgentX[13] - 安克创新确定机器人战略，涵盖机器狗、人形机器人等产品[13] - 百度上线AI陪伴产品“月匣”App，搭载多个大模型构建“四核驱动”引擎[14] - 越疆科技发布全球首款“灵巧操作 + 直膝行走”具身智能人形机器人[14] - “小米人形机器人CyberOne即将量产”消息不实[14] - 罗永浩AR创业公司细红线春招启动，软件产品部门开放PM岗[15] - 饿了么累计清退超3.1万家违规商户，借助AI打击“幽灵外卖”[16] - 李彦宏称2025年可能成AI智能体爆发元年，需加大AI相关投入[16] - 北京机器狗“入编”巡逻，效率提升3倍，与无人车高效协作[17] - 360公司AI发布会盗图版权争议升级，当事人被起诉索赔10万元[17][18] - 壶化股份研制成功隧道爆破智能装药机器人[18] 海外大事 - 英特尔任命陈立武为新CEO，股价涨超10.59%，美银美林上调评级[18] - 谷歌推出号称“单GPU运行最强模型”Gemma 3，引入多模态能力[19] - 谷歌DeepMind发布用于机器人的AI模型[20] - 谷歌开源Gemma - 3，算力要求低，性能仅次于DeepSeek[21] - 谷歌计划1.15亿美元收购眼动追踪技术制造商AdHawk Microsystems[21] - 74%外国CEO担心两年内因AI失业，94%认为AI智能体可提供更好商业建议[22] - OpenAI发布研究，CoT监控可阻止大模型恶意行为，召回率达95%[22] - 马斯克X平台遭大规模网络攻击三次瘫痪，攻击者与春节攻击DeepSeek为同一僵尸网络[23][24] - 谷歌调整AI团队网页，删除“多样性”与“公平性”表述[24] - DeepMind两位顶尖科学家离职创办Reflection AI，融资1.3亿美元，估值5.55亿美元[24] - 马斯克旗下xAI在孟菲斯购地支持数据中心业务[25] - 美国司法部不再要求谷歌剥离AI投资，但坚持出售Chrome浏览器[26] - 微软开发AI推理模型与OpenAI竞争，测试不同来源模型[26] - 约翰斯・霍普金斯大学研制出可自适应调整握力的机械手[26] - 印度推出首台量产人形机器人Spaceo，网友质疑其实用性[27] AI投融资概览 - 本周全球披露AI融资事件12个，较上周减少10个，已披露融资金额事件8个，总融资规模28.25亿元，平均3.53亿元[29] - 阶段分布：早期8个、成长期2个、后期2个[30] - 地区分布：国内主要集中在北京、上海、江苏、浙江、山东，北京6起，上海2起，江苏、浙江、山东各1起[32] - 国内AI融资/IPO事件：本周国内AI领域已披露融资总额10.33亿元，智谱AI完成5亿人民币D + 轮融资[35] - 海外AI融资事件：本周海外AI领域已披露融资总额17.92亿元，Celestial AI完成2.5亿美元C + 轮融资[38]

能折纸，还会灌篮！谷歌发布机器人基座大模型，大幅强化机器人通用性

硬AI· 2025-03-13 19:19

核心观点 - 谷歌旗下DeepMind发布全新AI模型Gemini Robotics和Gemini Robotics-ER，标志着通用型机器人技术的重大突破 [1][9] - 新模型使机器人具备环境适应、指令理解和操作灵活性三大核心能力，性能是之前最好模型的两倍 [10][9] - 行业进入加速发展阶段，预计2030年全球人形机器人年销量达100万台，2060年总保有量达30亿台 [13] 技术突破 - 机器人可完成复杂任务：折叠纸狐狸、整理桌面、拉开拉链、迷你篮球灌篮 [3][4][5][6] - 突破传统手动编程模式，通过AI技术实现快速环境适应和新技能学习 [8] - 模型基于Gemini 2.0语言模型开发，支持云端流畅运行，利用谷歌大规模数据计算优势 [10] 行业动态 - 科技巨头加速布局：DeepMind与Apptronik合作开发人形机器人，特斯拉、OpenAI等公司同步推进AI大脑研发 [8][13] - 资本市场反应积极：谷歌母公司Alphabet股价当日上涨1.82%至169.00美元 [1] - 行业前景广阔：英伟达CEO预测该技术将创造数万亿美元市场，可能成为最大科技产业 [13] 专家评价 - 加州大学伯克利分校教授认为技术建立在谷歌数据计算优势上，是"令人兴奋的进展" [10] - 麻省理工学院教授评价Gemini是"重要的一步"，但指出通用型机器人商业化仍需完善 [10][11] - 美银分析师预测人形机器人将在十年内实现多行业应用爆发 [13]

速递｜Google推出新AI模型，Gemini Robotics可实现多硬件机器人语音操控

Z Potentials· 2025-03-13 12:02

Google DeepMind推出Gemini Robotics AI模型 - Google DeepMind于3月12日发布专为机器人控制设计的AI模型Gemini Robotics 该模型使机器人能够与物体互动并导航环境[1] - 演示视频显示配备Gemini Robotics的机器人可执行折叠纸张放置眼镜等精细任务响应语音指令[1] - 模型经过跨硬件训练能将视觉输入与动作关联在未经训练的环境中仍表现优异[1] 技术应用与开放资源 - 实验室同步推出精简版Gemini Robotics-ER 供研究人员训练自定义机器人控制模型[1] - 推出Asimov基准测试框架用于评估AI驱动机器人的操作风险[1] 注：文档2和文档3内容与核心科技主题无关未予收录

Artificial Intelligence

Gemini Robotics

Gemini Robotics-ER

Asimov

Artificial Intelligence

Gemini Robotics

Gemini Robotics-ER

Asimov