Gemini Robotics

搜索文档
谷歌创始人:不看好人形机器人,硬件很炫酷,但软件是短板
Robot猎场备忘录· 2025-06-05 13:37
谷歌联合创始人谢尔盖·布林对人形机器人的观点 - 机器人硬件炫酷但软件系统存在短板 目前离真正实用仍有距离 [1] - 不看好人形机器人形态 认为执着于人形可能低估AI的适应能力 [1][2] - 认为AI可通过仿真模拟快速适应环境 不一定要拥有人类数量肢体才能有效工作 [2] - 曾表示机器人技术虽神奇但未达日常使用水平 看不到具体前景 [2] 具身智能赛道主要参与者 - 特斯拉是人形机器人赛道引领者 Optimus是行业标杆 [3] - 英伟达从芯片和中间件层面入局 打造底层开发生态 [3] - 谷歌Deepmind是具身智能大模型研究引领者 最早布局大模型 [3] - 谷歌2017年提出Transformer架构 成为大语言模型底层基座 [3] - 谷歌模型从Saycan迭代到RT-H 在软件层面步步为营 [3] 谷歌DeepMind最新机器人模型进展 - 2025年3月推出基于Gemini 2.0的两个机器人模型 [5] - VLA模型Gemini Robotics可让机器人理解执行新任务 [5] - VL模型Gemini Robotics-ER增强对物理世界理解 特别是空间推理 [5] - 已与Apptronik、Agile Robots、Boston Dynamics等展开合作 [8] - 依托Gemini多模态世界理解能力 加入物理行动新模态 [9] 人形机器人行业现状与问题 - 炫技视频多为预设动作序列 依赖遥控器和预先编程 [10][11] - 国内企业陷入"炫技"死循环 展示功夫、空翻等与商业化关联不大 [11][13] - 运动能力展示收效佳但实际技术未达生产力时代要求 [10][11] - 国内发展乱象包括重"运动"轻"大脑" 商业化路径不清晰 [11][15] - 部分企业通过ToG和ToB展示场景实现现金流 但持续价值存疑 [15][16] 人形机器人技术发展方向 - 需要实现四个可达:移动、操作、语义、价值和智慧 [11] - 关键突破在于手眼脑协调 才能赋能千行百业 [10] - Gemini Robotics模型特点包括通用性、交互性、灵巧性等 [12] - 采用云端与本地端结合方式 主干网络在云端 Action decoder在机器人芯片 [12] 行业资本与商业化现状 - 赛道受资本和政策扶持 但出现"揠苗助长"趋势 [16] - 商业化核心在于创造持续价值 而非研究或展示需求 [15] - 技术突破和场景探索是关键 但"大脑"突破仍道阻且长 [16] - 部分企业凭借低价策略和营销迅速出圈 但面临流量反噬风险 [15][24]
CB Insights预测:人形机器人市场规模预计一年翻番 | Jinqiu Select
锦秋集· 2025-05-21 21:04
人形机器人市场概况 - 2024年人形机器人市场融资金额创下12亿美元纪录,预计2025年将达到23亿美元规模,一年内翻倍增长[1] - 工业类人形机器人2024年融资额飙升至9.04亿美元,交易量达40笔峰值,2025年迄今12笔交易吸金6.44亿美元,单笔规模显著扩大[2][5] - 前十大企业融资合计近72亿美元,Meta、小米、优必选、特斯拉四家上市公司吸走近60%资金,私募领域Figure以8.54亿美元融资规模突出[2][11][12] 融资与估值趋势 - Figure和Skild AI成立不足3年估值分别达27亿和15亿美元,Apptronik在A轮融得4.03亿美元[2][18] - Figure的27亿美元估值已超过2024年独角兽公司16亿美元中位估值,市场传言其计划以395亿美元估值进行新一轮15亿美元融资[19][20] - 过去15年工业类人机器人领域典型退出案例仅10起,估值跨度从Addverb的2.44亿美元到优必选的48亿美元[10] 技术发展路径 - Physical AI突破重新定义硬件与软件的杠杆,多模态感知、语言理解与运动控制融合推动估值飙升[2][18] - 产业路线出现"开源协同"和"封闭垂直"两极分化,Boston Dynamics等开放模型快速迭代,Figure、Tesla选择软硬深度耦合[2][34] - 基础模型在复杂物理推理方面仍有局限,需要大量计算资源和训练数据,大公司依靠AI基础设施获得优势[47] 商业化应用 - 企业部署场景从"替代人工"转向"嵌入式协同",BMW、奔驰、Amazon等已在实际场景中应用[2][36][38] - 中美竞争格局清晰,美国占32%企业数量依托芯片优势,中国厂商以1.37万-2.75万美元超低定价撬开市场[23][25][31] - Figure与Agility Robotics建设年产万台级工厂,Tesla计划年产数百万台Optimus机器人,售价2万美元以下[26] 科技巨头布局 - Google推出Gemini Robotics强调通用性、交互性与灵巧度,Nvidia用Isaac GR00T映射自然语言到机器人操作[2][41][42] - 三星收购Rainbow Robotics,现代并购Boston Dynamics,苹果、Meta保密式研发,科技公司通过"基础模型+并购+内部孵化"三管齐下[2][41] - 百度、华为、Meta、微软开发Physical AI基础模型,Nvidia在基础模型领域领先[41]
谷歌VS Figure AI VS成都:人形机器人的“脑”力角逐
机器人大讲堂· 2025-04-22 16:28
全球人形机器人产业技术革命 - 全球人形机器人产业正迎来"大脑"技术革命,2025年初美国Figure AI、谷歌DeepMind和成都人形机器人创新中心先后发布通用具身智能大模型,争夺产业标准话语权 [1] 谷歌DeepMind技术路径 - 谷歌DeepMind发布基于Gemini 2.0的机器人AI模型Gemini Robotics和Gemini Robotics-ER,目标构建通用机器人生态 [1] - Gemini Robotics在泛化性、交互性和灵巧性三方面提升:泛化能力比现有模型提高一倍,能处理训练中未遇到的任务;语言理解能力优秀,可实时调整路径;能精确操作复杂多步骤任务 [1][3] - Gemini Robotics-ER专注于增强空间推理能力,如识别咖啡杯把位置并规划安全接近路径 [5] Figure AI技术路径 - Figure AI发布Helix端到端视觉-语言-动作通用控制模型,泛化能力、动作精度与实时性显著提升,已在宝马工厂试点 [5] - Helix采用"系统1+系统2"双系统架构:S2解析指令并规划任务目标,S1以毫秒级响应生成动作;具备跨物体泛化能力,可直接部署在低性能芯片上;支持多机器人协作,共享神经网络权重和实时环境感知数据 [5][7] 成都创新中心技术路径 - 成都人形机器人创新中心发布Raydiculous—1系统,国内首个基于3DSGs的自主跨空间任务规划推理执行系统,突破单一场景限制 [9] - Raydiculous—1具有跨场景、长视野、轻量型特点:通过3DSGs实现跨空间连续任务执行;采用长视野任务规划引擎分解复杂任务;模块化设计降低算力需求,硬件成本仅为同类方案1/3 [10][12][15] 技术路径对比 - 谷歌依赖云端算力打造通用机器人生态,Figure AI专注工业场景实时响应,成都方案侧重家庭服务等民生领域轻量化本地部署 [16] - 核心差异:算力需求方面谷歌需千卡集群而成都成本优势显著;联网需求方面谷歌需联网而Figure与成都减少云端依赖;规划能力方面成都具备长视野跨空间优势 [17] - 三家均采用"规划-执行"分层策略,致力于提升机器人日常事务与家务劳动能力 [17] 产业竞争格局 - 人形机器人"大脑"技术是算法竞赛与国家高端制造能力的试金石,中国通过根技术创新可能绕开欧美技术霸权开辟万亿美元级市场 [18] - 产业生态涉及工业机器人、服务与特种机器人、医疗机器人、人形机器人及核心零部件企业 [23][24][25]
研报 | 英伟达发布开源Isaac GR00T N1,预计2028年全球人形机器人市场产值达40亿美元
TrendForce集邦· 2025-03-19 16:41
文章核心观点 英伟达GTC 2025发表的Isaac GR00T N1通用人形机器人基础模型有望加速研发进度、缩短产品上市准备期,推升全球人形机器人市场产值于2028年接近40亿美元,且英伟达在人形机器人领域已完整布局产品技术,其建立的生态系将维持封闭,为公司构筑“护城河” [1][4] 分组1:行业趋势 - 英伟达GTC 2025发表的Isaac GR00T N1通用人形机器人基础模型具备完整资料集、多模式输入和开源特性,可加速研发进度、缩短产品上市准备期,预期该领域产品提前放量,2028年全球人形机器人市场产值接近40亿美元 [1] 分组2:模型对比 - Figure AI和Google分别推出的Helix和Gemini Robotics架构与GR00T N1皆整合动作与思考模型提升自主决策能力,但英伟达模型的数据完备度、部署弹性略胜一筹 [2] - 对比GROOT N1、Gemini Robotics、Helix三款模型,在推出厂商、日期、技术架构、功能特点、开源与否、主要应用方面存在差异 [3] 分组3:英伟达布局 - 英伟达创办人黄仁勋看好人形机器人发展,公司已在该领域完整布局产品技术,硬件端有适用于不同类型机器人的嵌入式AI运算系统 [3] - 英伟达Omniverse聚焦训练模拟与数字孪生,多家中国人形机器人大厂搭载其训练平台,加上发表的机器人开源物理引擎、生成合成数据技术及GR00T N1,打造出完整生态圈 [4] 分组4:商业模式 - 尽管GR00T N1开源,但训练参数与硬件配置有一定绑定,使用该模型的开发商预计仍采用英伟达硬件解决方案,其生态系将维持封闭,为公司构筑“护城河” [4]
闯红灯、压线变道…特斯拉FSD入华“水土不服”,消息称正与百度合作解决;机器人能骑自行车了,“稚晖君”新款机器人亮相丨AI周报
创业邦· 2025-03-15 10:42
文章核心观点 文章为全球AI产业周报,精选3.8 - 3.14最值得关注的AI新闻和国内外热门AI投融资事件,帮助了解全球AI市场动向[2] 本周AI热点资讯 国内大事 - 特斯拉与百度合作提升中国市场ADAS性能,解决FSD“水土不服”问题,百度工程师团队前往特斯拉北京办公室整合地图信息[4][5] - 阿里巴巴推出AI旗舰应用新夸克,升级为“AI超级框”,满足用户各类AI需求[5] - 腾讯向英伟达采购数十亿元规模H20芯片,或为应对微信接入DeepSeek需求[6] - 文远知行开启北京南站Robotaxi商业收费服务,服务范围突破600平方公里[7] - AI视频创企鹿影科技将被MiniMax收购,2024年天使轮融资时估值约1亿人民币[7] - Manus使用申请等候名单达两百万人,与阿里通义千问团队达成战略合作,产品基于阿里千问大模型开发[7][8] - 字节去年曾想3000万美金收购Manus团队,因出价低被拒,目前公司估值接近一亿美元[8] - 周鸿祎称Manus产品体验创新不错,但与DeepSeek成功不是一个数量级[9] - Manus邀请码在闲鱼高价标价,被质疑“饥饿营销”,官方回应是服务器容量有限[9] - Manus官方X账号被冻结后解封,可能与第三方提及加密货币诈骗有关[10] - 00后主播用DeepSeek直播1天卖出3.3亿元,团队用AI整理话术提升效率[10] - 小米汽车1000万Clips版本智驾模型将很快上线[11] - 字节跳动AI大将骆怡航加盟生数科技任CEO[11] - 阿里开源全模态模型R1 - Omni,情感识别能力更优[11] - 智元机器人发布全能探索机器人灵犀X2和首个通用具身基座大模型GO - 1[12][13] - 西湖大学发布具备自我进化能力的智能体AppAgentX[13] - 安克创新确定机器人战略,涵盖机器狗、人形机器人等产品[13] - 百度上线AI陪伴产品“月匣”App,搭载多个大模型构建“四核驱动”引擎[14] - 越疆科技发布全球首款“灵巧操作 + 直膝行走”具身智能人形机器人[14] - “小米人形机器人CyberOne即将量产”消息不实[14] - 罗永浩AR创业公司细红线春招启动,软件产品部门开放PM岗[15] - 饿了么累计清退超3.1万家违规商户,借助AI打击“幽灵外卖”[16] - 李彦宏称2025年可能成AI智能体爆发元年,需加大AI相关投入[16] - 北京机器狗“入编”巡逻,效率提升3倍,与无人车高效协作[17] - 360公司AI发布会盗图版权争议升级,当事人被起诉索赔10万元[17][18] - 壶化股份研制成功隧道爆破智能装药机器人[18] 海外大事 - 英特尔任命陈立武为新CEO,股价涨超10.59%,美银美林上调评级[18] - 谷歌推出号称“单GPU运行最强模型”Gemma 3,引入多模态能力[19] - 谷歌DeepMind发布用于机器人的AI模型[20] - 谷歌开源Gemma - 3,算力要求低,性能仅次于DeepSeek[21] - 谷歌计划1.15亿美元收购眼动追踪技术制造商AdHawk Microsystems[21] - 74%外国CEO担心两年内因AI失业,94%认为AI智能体可提供更好商业建议[22] - OpenAI发布研究,CoT监控可阻止大模型恶意行为,召回率达95%[22] - 马斯克X平台遭大规模网络攻击三次瘫痪,攻击者与春节攻击DeepSeek为同一僵尸网络[23][24] - 谷歌调整AI团队网页,删除“多样性”与“公平性”表述[24] - DeepMind两位顶尖科学家离职创办Reflection AI,融资1.3亿美元,估值5.55亿美元[24] - 马斯克旗下xAI在孟菲斯购地支持数据中心业务[25] - 美国司法部不再要求谷歌剥离AI投资,但坚持出售Chrome浏览器[26] - 微软开发AI推理模型与OpenAI竞争,测试不同来源模型[26] - 约翰斯・霍普金斯大学研制出可自适应调整握力的机械手[26] - 印度推出首台量产人形机器人Spaceo,网友质疑其实用性[27] AI投融资概览 - 本周全球披露AI融资事件12个,较上周减少10个,已披露融资金额事件8个,总融资规模28.25亿元,平均3.53亿元[29] - 阶段分布:早期8个、成长期2个、后期2个[30] - 地区分布:国内主要集中在北京、上海、江苏、浙江、山东,北京6起,上海2起,江苏、浙江、山东各1起[32] - 国内AI融资/IPO事件:本周国内AI领域已披露融资总额10.33亿元,智谱AI完成5亿人民币D + 轮融资[35] - 海外AI融资事件:本周海外AI领域已披露融资总额17.92亿元,Celestial AI完成2.5亿美元C + 轮融资[38]
能折纸,还会灌篮!谷歌发布机器人基座大模型,大幅强化机器人通用性
硬AI· 2025-03-13 19:19
核心观点 - 谷歌旗下DeepMind发布全新AI模型Gemini Robotics和Gemini Robotics-ER,标志着通用型机器人技术的重大突破 [1][9] - 新模型使机器人具备环境适应、指令理解和操作灵活性三大核心能力,性能是之前最好模型的两倍 [10][9] - 行业进入加速发展阶段,预计2030年全球人形机器人年销量达100万台,2060年总保有量达30亿台 [13] 技术突破 - 机器人可完成复杂任务:折叠纸狐狸、整理桌面、拉开拉链、迷你篮球灌篮 [3][4][5][6] - 突破传统手动编程模式,通过AI技术实现快速环境适应和新技能学习 [8] - 模型基于Gemini 2.0语言模型开发,支持云端流畅运行,利用谷歌大规模数据计算优势 [10] 行业动态 - 科技巨头加速布局:DeepMind与Apptronik合作开发人形机器人,特斯拉、OpenAI等公司同步推进AI大脑研发 [8][13] - 资本市场反应积极:谷歌母公司Alphabet股价当日上涨1.82%至169.00美元 [1] - 行业前景广阔:英伟达CEO预测该技术将创造数万亿美元市场,可能成为最大科技产业 [13] 专家评价 - 加州大学伯克利分校教授认为技术建立在谷歌数据计算优势上,是"令人兴奋的进展" [10] - 麻省理工学院教授评价Gemini是"重要的一步",但指出通用型机器人商业化仍需完善 [10][11] - 美银分析师预测人形机器人将在十年内实现多行业应用爆发 [13]
速递|Google推出新AI模型,Gemini Robotics可实现多硬件机器人语音操控
Z Potentials· 2025-03-13 12:02
Google DeepMind推出Gemini Robotics AI模型 - Google DeepMind于3月12日发布专为机器人控制设计的AI模型Gemini Robotics 该模型使机器人能够与物体互动并导航环境[1] - 演示视频显示配备Gemini Robotics的机器人可执行折叠纸张 放置眼镜等精细任务 响应语音指令[1] - 模型经过跨硬件训练 能将视觉输入与动作关联 在未经训练的环境中仍表现优异[1] 技术应用与开放资源 - 实验室同步推出精简版Gemini Robotics-ER 供研究人员训练自定义机器人控制模型[1] - 推出Asimov基准测试框架 用于评估AI驱动机器人的操作风险[1] 注:文档2和文档3内容与核心科技主题无关 未予收录