Workflow
Robot猎场备忘录
icon
搜索文档
裁员、量产搁置,特斯拉Optimus团队恐迎至暗时刻!
Robot猎场备忘录· 2025-06-20 23:26
温馨提示 : 点击下方图片,查看运营团队2025年6月最新原创报告(共235页) 说明: 欢迎 约稿、刊例和商务合作、行业人士交流 , 行业交流记得先加入 "机器人头条"知识星球 ,后添加( 微信号: lietou100w )微信; 若有侵权、改稿请联系编辑运营(微信:li_sir_2020); 正文: 北美最新信息(6月20日):特斯拉Optimus机器人事业部 七月起将开启裁员1/3的流程 ,由新任领导人亲自主 持; 年内暂不再采购任何机器人零部件 ,同时 将明年量产目标调整为3000台 。 (此消息由小编团队运营微信群成员 分享) 更有媒体发布信息称,某特斯拉tier1表示: 确实有砍,之前5月初下来的2500台,还没交的都让先别交了 。 若消息属实,全球人形机器人赛道势必迎来一定时间寒冬期,让我们拭目以待。 其实,自从特斯拉Optimus机器人部门负责人米兰·科瓦奇(Milan Kovac)于6月6日宣布离职,后续将由 人工智 能软件部门副总裁 阿肖克·埃卢斯瓦米 (Ashok Elluswamy)接任后,有关Optimus负面信息一直不断。 有关离职详细资讯,查看往期文章: Optimus项目负责人 ...
技术干货:VLA(视觉-语言-动作)模型详细解读(含主流玩家梳理)
Robot猎场备忘录· 2025-06-20 12:23
温馨提示 : 点击下方图片,查看运营团队2025年6月最新原创报告(共235页) 说明: 欢迎约稿、刊例合作、行业人士交流 , 行业交流记得先加入 "机器人头条"知识星球 ,后添加( 微信号:lietou100w ) 微信; 若有侵权、改稿请联系编辑运营(微信:li_sir_2020); 正文: 早期小编整理文章 【技术干货】"具身智能 "技术最全解析 , 本篇文章重点解读现阶段大火的 视觉-语言-动作 (VLA)模型, 一种整合视觉(Vision)、语言(Language)和动作(Action)的多模态模型 。 2022年,Google和CMU相继推出"SayCan"、"Instruct2Act" 工作,Transformer模型既看图、又读指令、还能 生成生成动作轨迹成为可能;2023年,随着谷歌DeepMind推出RT-2模型,机器人可以端到端地从给定的语言指 令和视觉信号,直接生成特定的动作,具身智能领域也迎来了一个新名词: VLA(Vision-Language-Action Model,视觉-语言-动作模型)。 VLA模型的整体框架可以被视为VLM与端到端模型的结合体,也被看作是端到端大模型2.0 ...
2025全球人形机器人赛道分析报告:具身智能大模型、商业化卡点及现状、产业链公司、发展趋势及投资分析
Robot猎场备忘录· 2025-06-19 00:54
全球人形机器人产业概览 - 人形机器人赛道在全球范围内受到前所未有的关注,资本宠儿,尤其在国内受到政策及政府基金扶持 [8] - 顶级投行摩根士丹利、高盛集团、花旗银行接连发布2025年人形机器人最新研报,肯定其广阔前景 [8] - 全球大厂入局具身智能赛道典型代表包括英伟达和特斯拉,双方创始人在CES2025大会期间宣布人形机器人时代即将到来 [8] - 人形机器人入局者从创业派为主转变为以汽车主机厂为代表的产业派和互联网、电子商务、消费电子等科技大厂为主 [9] 全球主流人形机器人公司梳理 - 特斯拉Optimus计划2025年生产5000台,2026年目标5万台,已订购零部件支持1-1.2万台生产 [40] - 优必选Walker S1在汽车制造工厂执行质量检测任务,准确率达99%,并与华为签署全面合作协议 [50] - 宇树科技H1登上春晚后火爆,但G1产品因实际性能与宣传差距遭遇流量反噬,被质疑为"影视"公司 [51][54] - 星海图完成A轮系列融资累计1亿美金,推出轮式仿生机器人R1系列,定价19.9万元起 [55] - Figure AI与OpenAI"分手"后加速商业化,估值冲击369亿美元 [39] 技术瓶颈:机器人"大、小脑" - 人形机器人三大核心技术能力为运动控制、环境感知和人机交互,硬件市场基本成熟,软件算法仍需突破 [58][64] - 双系统架构技术路径VLA模型成为主流,将端到端模型拆分为VLM和动作执行两个模型 [66][70] - DeepSeek-R1开源模型性能对标OpenAI o1,训练成本仅557.6万美元,可能重构行业竞争格局 [72][73] - 灵巧手及多模态触觉感知传感器研发公司迎来融资潮,被视为机器人商业化关键部件 [18] 人形机器人核心零部件及产业链 - 特斯拉Optimus采用22自由度灵巧手,机械臂使用永磁电机,几乎所有部件均为新开发 [40] - 宇树科技G1关节模组成本控制在1万美元以内,采用低价+全开源策略吸引科技DIY爱好者 [42][43] - 优必选Walker S1与无人叉车协同作业,形成智慧物流解决方案,已签约批量采购合同 [50] - 国内116家人形机器人企业中,65%集中在科研场景交付,商业化落地仍以展示、表演为主 [10][23]
具身智能领域,全球Top50国/华人图谱(含具身智能赛道“师徒关系图”)
Robot猎场备忘录· 2025-06-18 12:48
具身智能技术发展 - 具身智能赛道涉及大语言模型(LLM)、视觉多模态模型(VLM)、强化学习(Reinforcement Learning)、深度强化学习(Deep Reinforcement Learning)、模仿学习(Imitation Learning)等前沿技术 [1] - 人形机器人算法从早期基于模型的控制算法(LIPM+ZMP)发展到动态模型控制(MPC+WBC),再到当前主流的模拟+强化学习(IL+RL) [1] - IL+RL成为人形机器人公司最常采用的技术路径,主要由高校和头部科技大厂研发机构主导 [1] 顶尖研究机构与人才分布 - UC Berkeley在AI+Robotics研究领域排名第一,斯坦福大学次之 [2] - 全球Top50华人研究者主要毕业于UC Berkeley、斯坦福大学、MIT、CMU等顶尖院校,并师从行业权威导师 [4] - 具身智能领域华人学者普遍具有"清华大学-UC Berkeley-清华交叉信息研究院-创业"的职业发展路径 [2] 代表性华人学者与创业案例 - UC Berkeley"归国四子"吴翼、高阳、许华哲、陈建宇均师从Vision领域权威Trevor Darrell教授,后加入BAIR实验室并创业 [2] - 斯坦福博士王鹤师从美国三院院士Leonidas J Guibas,现任北大助理教授并创立银河通用机器人公司 [3] - 卢策吾曾任斯坦福AI实验室博士后(导师李飞飞/Leonidas Guibas),现为上海交大教授兼非夕科技首席科学家、穹彻智能创始人 [3] 行业研究资源 - 全球AI+Robotics领域华人图谱包含50位顶尖研究者的院校背景、导师关系、科研成果及创业公司详情 [3][5] - 行业研究资料涵盖具身智能赛道"师徒关系图"及970+从业者的深度讨论资源 [5]
比亚迪重投的人形机器人创企,又完成新一轮融资!
Robot猎场备忘录· 2025-06-18 12:48
公司融资与股东结构 - 帕西尼感知科技于2025年6月13日完成A+轮融资,投资方包括TCL创投、毅达资本、尚颀资本、基石资本等多家知名机构,资金将用于触觉感知技术迭代、具身智能大模型研发及产线扩张[1][2] - 公司累计完成六轮融资,总金额达数亿元,比亚迪为第一大外部股东(持股11.9573%),北汽产投亦参与A1轮融资[3] - 比亚迪通过投资帕西尼感知和智元机器人(持股2.3173%)布局具身智能赛道,并于2024年成立AI实验室专攻人形机器人研发[3] 核心技术及产品 - 公司以ITPU多维触觉传感技术为核心,覆盖触觉传感器、灵巧手及人形机器人全产品线,是全球首家实现多维触觉传感器商业化的企业[8][11] - 核心产品包括:DexH13四指仿生灵巧手(集成触觉与AI视觉)、Tora One轮式仿生机器人(触觉+视觉多模态感知)、PX系列触觉传感器及PXR关节模组[10][11] - 自主研发HAPTA异构多核阵列架构和ITPU传感单元,支持毫秒级决策,触觉感知单元达1956个[11][12] 商业化与行业地位 - 公司触觉传感器出货量居国内多维度阵列触觉传感器领域第一,产品被多数人形机器人厂商采用[14] - 前瞻性布局MotionSharing DB多模态物理交互数据集,并开发TacFlow Engine大模型,构建"感知-数据-决策"闭环[12] - 天津建成超大规模具身智能数据采集工厂,强化数据积累能力[12] 行业趋势与竞争格局 - 具身智能赛道吸引车企、自动驾驶技术人才及产业链公司涌入,形成行业主流派系[5][19] - 灵巧手及触觉传感器初创企业受资本青睐,如灵心巧手(超亿元种子轮)、源升智能(深创投领投天使轮)[18][19] - 特斯拉、Figure AI、智元机器人等头部企业均自研灵巧手,自由度达16-22个,触觉传感器成为商业化关键[20][22][23] 公司创始团队与背景 - 创始团队来自日本早稻田大学机器人实验室,创始人许晋诚师从机器人权威菅野重树教授(加藤一郎弟子)[8] - 竞品包括戴盟机器人(推出Sparky 1人形机器人),同样聚焦触觉感知技术[16]
又有“学院派”大佬入局具身智能赛道,已完成天使轮融资!
Robot猎场备忘录· 2025-06-17 00:02
公司融资与背景 - 北京智在无界科技有限公司完成数千万元天使轮融资,由联想之星领投,智谱Z基金、燕缘创投、彬复资本跟投,资金将用于核心技术研发和模型迭代[1] - 公司由北京大学卢宗青副教授于2025年1月21日创立,专注人形机器人通用大模型的研发与应用[1] - 卢宗青现任北京大学计算机学院长聘副教授、博导,曾在新加坡南洋理工大学获得博士学位,并在美国宾州州立大学从事博士后研究,主要研究强化学习、多模态大模型和通用智能体[2] 核心技术 - 公司通用大模型系统分为具身多模态大语言模型、多模态姿态大模型和运动模型三层,并搭建了自学习具身智能体框架[5] - 通过海量互联网第一人称视频和少量遥操作数据训练智能体,提出多模态姿态模型,利用互联网视频资源预训练通用动作模型,解决真机数据稀缺与场景泛化的矛盾[6] - 自主研发Video Tokenizer技术,强调时空环境的理解与推理能力,特别是针对第一人称视角视频内容的解析[11] - 提出Retriever-Actor-Critic框架,通过真实交互数据的RAG与强化学习协同应用,形成"数据收集-模型优化-效果反馈"的闭环[11] 产品进展 - 卢宗青团队联合智源研究院发布首个面向人形机器人的通用智能体Being-0,采用模块化的分层端到端架构,仅需互联网视频+少量真机数据即可实现复杂推理和长程任务[7][8] - 公司正与头部机器人厂商推进场景验证合作,加快具身智能在更多领域的应用落地[9] 行业对比 - 特斯拉Optimus采用类似训练路线,完全在虚拟环境中进行训练并实现"零样本转移",利用第一人称视角视频直接迁移学习成果[11][12] - 全球具身智能领域公司超过200家,主要分为专注具身智能大模型、人形机器人本体和两者同时涉及三类,智在无界目前专注具身智能大模型研发[15] - 软件算法是推动人形机器人功能提升和应用场景拓展的关键,具身智能大模型创企或具备强大AI能力的人形本体初创公司成为资本市场关注重点[16]
估值150亿元后,「智元机器人」资本层面再迎大动作!
Robot猎场备忘录· 2025-06-16 02:46
公司概况 - 智元机器人成立于2023年2月,核心创始团队包括华为前高管邓泰华(CEO)、邱恒(COO)等,采用"高举高打"的华为生态打法[9][10] - 公司估值超150亿元,累计完成10轮融资,为国内具身智能领域估值最高的初创企业[3][8] - 已形成远征、Genie、灵犀三大产品线,覆盖全尺寸双足人形机器人、轮式双臂机器人等商用产品矩阵[15][17] 资本运作 - 2025年先后获腾讯(B轮)、京东(B+轮)领投,两大互联网巨头首次布局具身智能领域[4][6] - 与高瓴资本合资成立瓴智新创(出资额1000万元),高瓴为第一大外部股东[1] - 融资节奏密集,A轮至A+++++++轮后快速进入B轮,投后估值达150亿元[8][3] 产业布局 - 投资6家上下游企业:希尔机器人(卧龙电驱)、灵猴机器人(博众精工)等,覆盖感知、大模型、电机等环节[2][3] - 合资模式加速:与均普智能、大丰实业等上市公司成立7家合资公司,聚焦零部件、量产及场景落地[11][12] - 技术合作广泛:联合科大讯飞、阶跃星辰开发AI大模型,与上海人工智能实验室攻关操作系统[14][20] 产品与技术 - 2024年发布远征A2系列(交互/柔性智造/重载)和灵犀X1系列(开源/数采)五款商用机型[15] - 灵犀X2系列2025年开启预订,售价10-40万元,预计当年量产数千台,主攻文娱展演场景[17] - 自研ViLLA架构的GO-1大模型,挖角伯克利BAIR博士后罗剑岚任首席科学家强化算法研发[20][21] 商业化进展 - 2024年12月启动量产,2025年1月第1000台下线(731台双足人形+269台轮式机器人)[22] - Genie产品线年收入达数亿元,轮式双臂机器人在科研场景销售数百台[22] - 采用华为式"合资+投资+合作"三维生态打法,快速成为产业链"链主"型企业[10][13] 行业定位 - 国内"实干派"代表,区别于宇树科技等"运动派",强调软硬一体全栈自研路线[19][23] - 率先实现从机器人本体、小脑到大脑的全栈技术布局,构建技术闭环[18][21] - 面临行业共性挑战:高估值下的持续融资压力、商业化落地效果待验证[3][22]
您我一起,聊一聊具身智能赛道那些事!
Robot猎场备忘录· 2025-06-15 01:35
人形机器人行业发展 - 特斯拉人形机器人Optimus在2022年10月第二届AI Day亮相,开启全球人形机器人浪潮 [1] - 2023年上半年高校教授主导的"学院派"创企(智元机器人、银河通用、逐际动力等)占据赛道半壁江山,2024年创企数量已超百家 [1] - 2025年行业格局多元化,传统机器人公司、汽车主机厂、科技大厂成为赛道主流 [1] 商业化进展与挑战 - 2024年被誉为人形机器人商业化落地"元年",但实际进展滞后 [2] - 2025年头部公司ToB场景现商业化曙光,但落地可行性仍存疑 [2] - 行业存在技术瓶颈短期内无法突破、商业化落地困难等"揠苗助长"现象 [4] 行业领袖观点 - 英伟达黄仁勋认为人形机器人是唯一会成功的通用机器人样式,将成为数万亿美元级产业 [2] - 特斯拉马斯克预测人形机器人数量将达数百亿,Optimus将成为特斯拉最重要产品之一 [2] - 特斯拉Optimus部门负责人离职事件引发对技术及量产进展的担忧 [2] 行业生态与竞争 - 当前创业潮复杂程度超越2016年自动驾驶热潮 [3] - 赛道呈现长周期特征,但资本过度关注导致非理性繁荣 [4] - 科技大厂(如英伟达、特斯拉)和车企成为主要推动力量 [2][27] 行业研究资源 - "机器人头条"知识星球提供行业深度内容,包括70篇原创专题、820+专栏内容、970+行业成员交流 [6][9][12] - 研究覆盖全球160+具身智能公司分析、产业链拆解、技术壁垒研究等 [19] - 定期输出原创报告,如《2025全球人形机器人领域深度报告》包含产品参数对比、商业化进展等19项内容 [19] 技术发展动态 - 行业面临算力、算法、数据、硬件、工程化等多层面商业化卡点 [14] - 开源大模型DeepSeek-R1对具身智能赛道产生重构影响 [14][26] - 头部企业专利、顶会论文(ICML/NeurIPS等)及技术突破被持续跟踪 [20] 市场参与者分析 - 全球人形机器人企业现况涵盖产品进展、硬件设施、量产时间等维度 [14] - 国内赛道存在政策驱动下的乱象,实际进展与宣传存在差距 [14] - 华为等科技巨头持续加码布局 [27]
最“出圈”的「宇树科技」,公司及王兴兴正遭遇流量反噬!
Robot猎场备忘录· 2025-06-13 18:03
宇树科技发展历程与市场表现 - 公司因春晚16台人形机器人H1表演火爆海内外,后续G1机型凭借720度回旋踢等炫技视频风靡网络,带动资本市场关注并形成"宇树链"概念股热潮[9][10] - 2025年5月完成企业名称变更并新增董事梁望南,IPO消息冲上热搜,同时被曝出2023年营收约2亿元、2024年营收4亿元,净利润区间1000万-7000万,2025年预计净利润达2亿元[10][19] - 旗下产品G1租赁市场一度火爆,单价9.9万设备日租金达1.5万元,早期租赁者声称"一周回本",但4月半马比赛表现不佳引发信任危机,租赁市场迅速降温[12][13] 人形机器人行业竞争格局 - "运动派"企业形成三足鼎立:宇树科技、众擎机器人(SE01直膝步态行走、PM01前空翻获中东2亿元投资)、松延动力(N2半马亚军带动订单超2000台,估值水涨船高)[10][15][17] - 行业陷入炫技循环,企业集中展示前空翻/后空翻/格斗等动作,虽与商业化场景关联弱但短期引流效果显著,宇树G1、众擎PM01等产品主要采购方为高校及科研机构[12][20] - 资本开始偏好AI能力突出的企业,智元机器人(估值150亿)因软件优势估值超宇树科技(估值100亿),反映技术路线分化趋势[22] 技术路线与商业化困境 - 运动派企业选择教育科研、表演展示等ToG/ToB场景切入,通过低价策略(宇树G1定价9.9万)和营销快速获客,但高盛报告指出其硬件尚无法处理通用任务[2][19][21] - 核心技术瓶颈在于"大脑"而非运动能力,炫技动作依赖预编程和遥控操作,大模型决定的泛化能力才是商业化核心壁垒,多数企业因技术限制被迫专注运动控制[21][22] - 行业面临朱啸虎指出的商业化路径不清问题,现阶段采购多来自研究展示需求,非真实场景应用,宇树2025年前5个月中标量虽接近2024年全年但后续市场乏力隐忧显现[20][22] 行业发展趋势 - 头部企业尝试突破炫技局限:宇树举办全球首场人形机器人格斗赛并预告新品,松延动力通过赛事验证技术可行性,反映行业从流量争夺转向技术验证[15][17] - 两条技术路线并存:硬件派(宇树)面临祛魅压力,软件派(智元)受制于商业化落地难度,行业共识是需要突破"大脑"算法瓶颈才能实现家庭/工业场景覆盖[22][23] - 政策与资本助推下行业出现揠苗助长现象,国内企业数量激增但存在重运动轻大脑、过度依赖预编程等乱象,需警惕短期流量反噬风险[21][22]
LeCun和世界模型V-JEPA 2:零样本机器人规划新时代!
Robot猎场备忘录· 2025-06-13 17:15
Meta AI战略调整与收购动态 - 公司计划以148亿美元收购AI数据标注企业Scale AI 49%股权,Scale AI CEO Alexandr Wang将加入Meta并领导新组建的超级智能实验室[1] - 图灵奖得主Yann LeCun领导的FAIR实验室因资源转向生成式AI产品团队而逐渐边缘化,核心技术人员接连离职[2] - FAIR实验室曾主导开源大模型Llama系列开发,但后续由生成式AI产品团队接管,目前聚焦高级机器智能(AMI)研究[2] 世界模型V-JEPA 2技术突破 - V-JEPA 2基于联合嵌入预测架构(JEPA),拥有12亿参数,专注于通过视频数据训练机器理解物理规律(如重力、碰撞)[7] - 模型实现零样本机器人规划能力,实验室测试中机器人成功抓取未见过物体,减少对特定任务训练数据的依赖[9] - 提供跨场景动作预测优化,工业场景中可模拟动作后果以提升效率与安全性[10] 具身智能领域应用前景 - 世界模型可赋能自动驾驶、机器人等自主系统,降低训练成本并加速虚拟到现实的知识迁移[16] - Meta发布三大基准测试(IntPhys 2、MVPBench、CausalVQA)评估AI对物理现象的理解能力[16] - 公司计划开发多模态JEPA模型,整合视觉、听觉和触觉信息,并探索跨时间尺度的分层学习[13] 行业竞争格局与Meta布局 - 全球仅少数企业专注世界模型研发,包括李飞飞的World Labs(融资2.3亿美元)和谷歌DeepMind的Genie项目[14] - 2025年Meta成立仿生人形机器人团队,目标打造类人任务执行能力,计划招聘100名工程师并由前Cruise CEO Marc Whitten领导[17] - 公司战略定位为机器人行业的"安卓平台",与Figure AI等企业合作提供底层AI技术[17] 科技巨头具身智能赛道动向 - 2024年四季度起,英伟达、苹果、OpenAI等国际大厂从AI赋能转向本体制造,国内蚂蚁、京东等跟进[17] - 大厂侧重"大脑"层技术突破,而非人形机器人硬件本体,目前AI能力仍是主要瓶颈[17] - 行业争议聚焦世界模型与具身智能大模型哪条路径更接近通用人工智能(AGI)[15]