Workflow
通用机器人
icon
搜索文档
IPO周报|宇树科技科创板IPO获受理;思谋科技冲刺港交所
IPO早知道· 2026-03-22 20:58
宇树科技科创板IPO - 公司于2026年3月20日科创板IPO申请获受理,拟募集资金42.02亿元,保荐机构为中信证券[2][3] - 公司成立于2016年,坚持通用机器人核心技术全栈自研,在全球四足及人形机器人市场占据主要份额[3] - 2022年至2024年及2025年前三季度,公司四足机器人销量合计超30,000台,2025年人形机器人出货量超5,500台,出货量全球第一[3] - 2025年公司营收达17.08亿元,同比增长335.36%,扣非后净利润为6.00亿元,同比增长674.29%[4] - IPO前,美团持有公司9.65%股份,为最大外部投资方,红杉中国和经纬创投分别持股7.11%和5.45%[4] 德适生物港股IPO - 公司于2026年3月19日至25日招股,计划3月30日以“2526”为代码在港交所主板上市,被称为“医学影像大模型第一股”[5][6] - 本次IPO计划发行7,999,200股H股,招股价区间为每股95.6至112.5港元,至多募集约9亿港元,IPO市值至多可达近百亿港元[6] - 公司成立于2016年,是一家专注于医学影像产品和服务的医疗器械公司,产品组合包括软件、设备、试剂及耗材等[6] - 核心产品AI AutoVision®为染色体核型辅助诊断软件,已于2025年5月提交第三类医疗器械注册申请并被认定为“三类创新医疗器械”[7] - 按2024年销售收入计算,公司在中国染色体核型分析领域市场份额为30.6%,位居首位[7] - 公司自主研发的iMedImage®医学影像基座模型可支持19种医学影像模态,覆盖超90%的临床医学影像场景[7][8] 思谋科技港股IPO - 公司于2026年3月16日正式向港交所递交招股书,拟主板挂牌上市,联席保荐人为摩根士丹利、中金公司和德意志银行[10] - 公司主要提供工业AI智能体,包括机器人、边缘AI传感器和智能体软件系统,或将成为“工业AI智能体第一股”[10][11] - 截至2025年12月31日,公司全球服务客户超730家,包括特斯拉、卡尔蔡司、立讯精密等知名企业[11] - 根据灼识咨询资料,公司是2025年中国收入规模最大的工业AI智能体提供商,并率先实现大规模、跨区域、多场景部署[11] - 2023年至2025年,公司营收分别为4.85亿元、7.56亿元和10.86亿元,2024年和2025年同比增速分别为55.9%和43.7%[11] - 2023年至2025年,公司毛利率分别为30.5%、32.3%和37.3%,呈持续上升趋势[11] - 公司IPO前最后一轮融资后估值为12.3亿美元,并曾获IDG资本、红杉中国等知名机构投资,以及香港投资管理公司的首笔投资[12][13]
研发占比仅7.7%!宇树科技披露招股书,王兴兴持股23.8%,美团、腾讯、阿里等加持!
搜狐财经· 2026-03-22 06:22
公司上市计划与募投项目 - 公司于3月20日正式披露科创板上市招股说明书,拟发行不低于总股本10%的股份,募集资金约42.02亿元 [1] - 募集资金将投向四个项目:智能机器人模型研发(20.22亿元)、机器人本体研发(11.10亿元)、新型产品开发(4.45亿元)及制造基地建设(6.24亿元) [9] - 公司选择适用科创板特别表决权上市标准,预计市值不低于100亿元 [1] 核心财务表现与增长 - 2025年度,公司经审阅营业收入达到17.08亿元,同比增长335.36%;扣非净利润为6.00亿元,同比增幅高达674.29% [3][5] - 2025年1-9月,公司实现营业收入11.67亿元,扣非净利润达4.31亿元 [3] - 2022年至2024年,公司主营业务收入复合增长率达78.73% [3] - 公司主营业务毛利率持续提升,从2022年的44.18%增长至2025年1-9月的59.45% [4] 业务结构与市场地位 - 人形机器人业务已成为公司第一大收入来源,2025年1-9月销售收入占主营业务收入的51.53%,首次超过四足机器人(42.25%) [4][6] - 2025年度,公司纯人形机器人(不含轮式双臂机器人)出货量超过5500台,位居全球出货量第一 [3][5] - 2022年至2025年9月,公司四足机器人销量合计超30,000台,奠定了全球四足机器人市场的优势地位 [5] 研发投入与技术实力 - 公司坚持核心部组件全栈自研,2022年至2024年累计研发投入1.50亿元 [8] - 2025年1-9月,研发费用为9020.94万元,占营业收入比例为7.73% [4][8] - 截至2026年1月31日,公司拥有262项专利权,其中境内发明专利20项 [8] - 公司研发人员175人,占员工总数36.46%,其中硕士及以上学历占比超40% [8] - 公司在运动控制技术方面取得多项突破,包括实现全球首例全尺寸电驱人形机器人原地后空翻,以及人形机器人奔跑速度突破5米/秒刷新世界纪录 [6] 股东结构与公司治理 - 发行前,公司实际控制人、董事长兼总经理王兴兴直接持股23.8216%,并通过员工持股平台合计控制34.7630%的股份 [8] - 在特别表决权安排下,王兴兴合计控制公司68.7816%的表决权比例 [8] - 公司股东包括多家知名投资机构,如汉海信息(美团旗下)、宁波红杉、经纬壹号、腾讯科技、中移和创、杭州灏月(阿里系)等 [9]
深度拆解宇树科技招股书:一年营收17亿,宇树机器人都卖给了谁?
经济观察报· 2026-03-20 22:11
公司概况与财务表现 - 公司于2026年3月20日披露科创板IPO招股说明书,拟发行不低于4044.64万股,募集42.02亿元[2] - 公司成立于2016年,创始人王兴兴持有23.82%股份并控制68.78%表决权,股东包括美团、红杉中国、经纬创投、腾讯等,2025年6月最近一轮融资后估值为127亿元[2] - 2025年度公司实现营业收入17.08亿元,同比增长335.36%[2] - 2025年度公司扣非后归母净利润为6.00亿元,同比增长674.29%[2] - 2025年度公司经营活动现金流量净额为6.72亿元[2] - 在通用机器人行业多数公司亏损的背景下,公司已实现盈利且利润增速远快于收入增速[1][2] 产品结构与收入演变 - 公司产品主要包括四足机器人和人形机器人两大类[5] - 2022年,公司全部机器人收入来自四足产品,人形机器人收入为零[5] - 2025年1—9月,人形机器人收入达5.95亿元,占机器人产品收入的51.53%,首次超过四足机器人的4.88亿元[5] - 报告期内(2022年至2025年1—9月)公司四足机器人累计销量超过3万台[5] - 2023年,公司首款全尺寸人形机器人H1上市,当年销售5台[5] - 2024年中型人形机器人G1上市后放量,全年销售410台[5] - 2025年,人形机器人出货量超过5500台[5] 客户结构与市场路径 - 公司客户分为三类:科研教育、商业消费、行业应用[8] - 四足机器人客户结构已演变:2022年科研教育收入占比68.61%,2025年1—9月商业消费成为第一大收入来源,占比42.30%,行业应用占比26.12%[8] - 四足机器人线上销售额从2024年全年的3037万元增长至2025年1—9月的1.36亿元,主要销售消费级产品[8] - 人形机器人客户结构仍以科研教育为主:2025年1—9月,科研教育占比73.60%,商业消费占比17.39%,行业应用占比9.01%[8] - 在人形机器人行业应用收入中,企业导览(展厅迎宾讲解)占50%到70%,而智能制造、智能巡检等明确工业场景收入为1570.20万元,仅占行业应用收入的29.29%[9] - 公司认为科研教育需求具有先导性和持续性,是推动机器人进入更多场景的路径[10] 定价策略与成本控制 - 公司以“价格屠夫”著称,消费级四足机器人Go2 Air价格降至万元以内,中型人形机器人G1起售价8.5万元,R1 Air进一步降至2.99万元[10] - 对比同行,波士顿动力四足机器人Spot售价约7.45万美元(约50万元人民币),Figure的人形机器人Figure 02售价约5.90万美元(约42万元人民币)[10] - 公司对电机、减速器、编码器、灵巧手、激光雷达等核心部件实现全栈自研自产,外购部件占总成本比例约为14%到18%[10] - 四足机器人单位成本从2022年的2.23万元降至2025年1—9月的1.21万元[11] - 人形机器人单位成本从2023年的7.32万元降至2025年1—9月的6.22万元[11] 盈利能力与毛利率分析 - 公司主营业务毛利率从2022年的44.18%上升至2025年度的60.27%[11] - 四足机器人整体毛利率从2022年的42.36%升至2025年1—9月的55.49%[13] - 四足机器人中,行业级B系列2025年1—9月毛利率为67.14%,消费级Go系列毛利率为50.51%[13] - B系列收入占四足机器人比例从2022年的13.76%升至2025年1—9月的30.00%,高毛利产品占比提升推高整体毛利率[13] - 人形机器人整体毛利率从2024年的68.44%降至2025年1—9月的62.91%,主要因价格更低、毛利率较低的中型G1产品收入占比从2024年的44.75%升至88.90%[13] - 人形机器人62.91%的毛利率仍高于四足机器人55.49%的毛利率,且其人形机器人收入占比过半进一步推高了综合毛利率[13] 市场地位与竞争格局 - 公司自称2025年人形机器人出货量超5500台,全球第一[16] - 市场研究机构Omdia报告显示2025年全球人形机器人出货量约1.3万台,智元超5100台排第一,公司4200台排第二,优必选1000台排第三,差异源于统计口径(公司仅统计双足行走产品,Omdia包含轮式等类人形态产品)[16] - 赛迪传媒报告统计口径与公司一致,结果显示公司5500+台第一、智元4000+台第二[16] - 2025年海外主要厂商Figure和Agility Robotics人形机器人出货量各约150台,特斯拉Optimus尚未对外发售[18] - 行业缺乏类似汽车上牌量的权威统计口径,不同机构数据差异明显[17] 技术实力与发展重点 - 公司技术结构分为“大脑”(具身大模型)、“小脑”(运动控制系统)和“本体”(机械硬件)[18] - 公司在“小脑”和“本体”方面实力强劲,创下多项运动性能世界纪录,如2025年人形机器人奔跑速度超5米/秒,2026年春晚25台机器人完成集群武术表演[19] - 在“大脑”层面,公司自研的VLA模型UnifoLM-VLA-0在LIBERO测试基准上以98.7分平均分排名第一[19] - 但全球具身大模型技术均处研发测试阶段,公司报告期内尚未将自研通用具身大模型规模化应用于已售产品,产品集成的是自研运动控制模型和第三方大语言模型[19] - 通用机器人大规模商业化的主要障碍在于:具身大模型泛化能力不足,以及灵巧手不够精细耐用[20] 募资用途与产能规划 - 募集资金42.02亿元中,85.15%用于研发类项目[21] - 最大单项是“智能机器人模型研发项目”,投入20.22亿元(占募资总额48.13%),聚焦“大脑”和“小脑”技术攻关[21] - 其他项目包括机器人本体研发项目11.10亿元、新型智能机器人产品开发项目4.45亿元,以及制造基地建设6.24亿元[21] - 智能机器人制造基地建成后,预计年产能为人形机器人7.5万台和四足机器人11.5万台[24] - 7.5万台人形机器人年产能是公司2025年出货量的十几倍,显示出对市场空间的乐观预期[24] - 公司创始人王兴兴公开表示,2026年机器人出货目标为1万到2万台[24] 行业趋势与市场环境 - 2026年一季度人形机器人单台成本已降至10万元,比2025年下降33%,多家厂商密集调低售价,行业价格战已开始[22] - 2026年前两个月,具身智能赛道大额融资密集出现,但资金几乎只流向头部公司,腰部以下企业融资困难[22] - 行业正在经历快速分化,具备大规模量产能力与人工智能技术资源的国际企业(如特斯拉)可能对市场参与者形成潜在影响[23] - 市场推广方面,2025年初公司人形机器人H1登上央视春晚,带动第二季度人形机器人收入环比暴涨167.15%,尽管第三季度热度回落收入环比下降32.22%,但第四季度收入达2.81亿元,同比增长3.81倍,接近第二季度水平[14] - 2025年12月末,公司在手订单2.82亿元,同比增长93.15%[14]
华为看好的具身公司又融 10 亿!极佳视界宣布完成 Pre-B 轮融资,老股东超额加持
AI前线· 2026-03-07 17:20
公司融资情况 - 公司于近期完成近10亿元Pre-B轮融资,资金将主要用于具身基础模型、世界模型和本体机器人的研发[2] - 本轮融资资方阵容覆盖产业资本、财务机构和国资平台组合,包括中芯聚源、浦科投资、临芯资本、星源资本、万林国际等芯片和汽车产业资本,以及中金资本、苏创投、华强资本等国资平台和财务机构[2] - 中金资本、华强资本、财鑫资本、张科垚坤等老股东在本轮融资中持续超额加持[2] - 此次Pre-B轮融资距离上一轮披露仅相隔两个多月,公司于2025年12月完成2亿元A2轮融资,由达晨财智领投,华控基金联合领投[2] - 公司在2025年内还连续完成了Pre‑A、Pre‑A+、A1三轮融资,其中A1轮由华为哈勃和华控基金联合投资[3] 公司业务与定位 - 公司是一家具身基模和通用机器人公司,专注于“世界模型驱动的物理世界通用智能”[3] - 公司产品包括世界模型平台GigaWorld、具身基础模型GigaBrain、通用具身本体Maker等物理AI全栈软硬件产品,致力于推动通用机器人进入千家万户[3] - 在具身基模方面,公司先后发布了GigaBrain系列具身基础模型、GigaBrain-0技术报告,并开源了GigaBrain-0、GigaBrain-0.1等基础模型[3] - 公司的开源模型GigaBrain-0.1在2026年2月初的RoboChallenge真机评测比赛中超越Pi0.5等模型,获得全球第一[3] 公司战略合作与创始人背景 - 除财务投资外,华为还从多条业务线与公司推进深度战略合作[3] - 公司创始人兼CEO黄冠为清华大学自动化系创新领军工程博士,曾任地平线视觉感知技术负责人、鉴智机器人合伙人兼算法副总裁,并曾在微软亚洲研究院、三星中国研究院等机构工作[3]
AMD英伟达都投了!李飞飞创业公司官宣10亿新融资
量子位· 2026-02-19 15:03
公司融资与估值 - World Labs完成10亿美元(约合人民币69亿元)新一轮融资,估值达到50亿美元 [1][2] - 本轮融资吸引了AMD、英伟达、Autodesk、富达、Emerson Collective、Sea等产业与财务投资者 [2][9] - 公司成立于2024年4月,在不到两年内估值经历5倍重估,融资速度超过Anthropic(后者花费25个月达到50亿美元估值) [4][5][7][8] - 截至本轮融资前,公司已完成累计2.3亿美元融资,估值达10亿美元级别 [19] 投资方战略布局 - 投资阵容构成围绕“空间智能”生态的产业合围,覆盖算力、应用、资本、市场等关键环节 [11][15] - AMD和英伟达代表算力与底层基础设施,押注空间智能对海量算力的需求 [12] - Autodesk(本轮投资2亿美元)对应3D设计与工业软件生态,是空间智能的落地方向之一 [13] - Sea Limited作为东南亚最大互联网生态之一,旗下游戏、电商与数字内容场景与虚拟空间高度相关,被视为通往新兴市场的入场券 [13] - 富达代表主流金融资本的认可,Emerson Collective则代表长期主义与影响力投资逻辑 [14] 公司核心技术与产品 - 公司核心使命是加速推进空间智能,构建世界模型,以革新故事讲述、创造力、机器人技术、科学发现等领域 [16][17] - 首款产品为第一代空间智能模型Marble,被非正式地称为“世界模型” [27] - Marble模型能接收文字、图片、视频或简单3D等多模态输入,并将其转化为几何一致、永久稳定、可导航交互的3D世界,支持机器人模拟、游戏开发等应用 [27] - 该模型在两个月前发布,被认为是目前最先进的3D生成世界模型 [28] - 与GPT-5等大语言模型相比,Marble模型规模小几个数量级,主要原因是3D/4D真实世界数据不足且领域年轻 [37] 行业前景与应用 - 空间智能被认为是AI的下一个前沿,是理解、推理、互动并导航于真实3D/4D物理世界的基础能力,与语言智能同等重要 [24][25][26] - 物理世界的理解和互动能力是实现AGI的关键一环,语言模型存在局限 [30] - Marble模型已展示出横向应用潜力,包括游戏开发、VFX特效、虚拟制片、室内设计、心理健康研究以及个性化健身训练等 [30][31] - 空间智能是横向技术,应用场景广泛,涵盖机器人、仿真、沉浸式娱乐、医疗、教育、金融、农业、制造业、城市规划等几乎无所不包的领域 [42] 创始人观点与行业洞察 - 创始人李飞飞认为AI发展速度令人屏息,同时担忧AI讨论的两极化,希望行业能更理性、更有建设性地讨论AI [33][34] - AI的成功应类比电力,其价值在于赋能文明,让每个人能更自由地追求幸福、尊严和繁荣 [35][36] - 针对3D/4D数据稀缺的挑战,公司采取混合数据策略,结合互联网规模的文本、图像、视频,以及模拟数据、真实世界采集数据和合成数据 [39] - 通用机器人的实现极具挑战性,比自动驾驶更复杂,涉及在三维空间中的精准交互,面临手部灵活度、视觉精度、空间理解等多重挑战 [40] - 公司致力于让AI真正理解并参与物理世界,从生成内容走向生成世界 [46]
“疯子”俞浩,一场天才的献祭
汽车商业评论· 2026-02-12 07:06
公司创始人俞浩的个人风格与言论 - 创始人俞浩在社交网络上高调张扬,ID为“俞浩-爱送黄金”,并在春节前夕为全体员工每人赠送1克黄金,部分优秀员工获赠“南极豪华游大礼包”[4][6] - 公司年会预算超过6000万元,以央视级制作规格和超豪华明星阵容出圈[6] - 俞浩在微博立下目标:五年内成为世界首富,而目前其个人财富约为85亿元,与世界首富马斯克的8520亿美元财富差距巨大[8] - 俞浩发布一系列激进言论,包括“三年内将公司员工从2万扩增至20万、实现万亿产值”、“打造人类首个百万亿美金公司生态”以及喊话余承东邀请其加入公司[8] - 俞浩频繁更新微博,一天可达数十条,并回应外界对其高调的质疑,称需要鼓励个性张狂,并自称“主动把自己献祭于一个更会被嘲笑的位置”[9][10] - 俞浩提及自己曾担任清华大学航空航天学院学生会主席,并暗示其言论经过深思熟虑,不会有风险[10] 创始人背景与早期经历 - 俞浩1987年出生于江苏南通,童年受“中国电动工具第一城”环境熏陶,喜欢拆解电器并绕线圈[13][14] - 12岁时自行摸索出双控电路,高中时期已在笔记本上构思设计并标注“待申请专利”[14][15] - 俞浩凭借物理竞赛金奖保送清华大学航空航天专业,未参加中考、高考及研究生考试[15][18] - 2007年,在大学期间组装出中国最早的四旋翼飞行器之一,其设计的飞机方案虽被导师否定,但最终获得波音公司资助并赢得清华“挑战杯”一等奖[18][19][20] - 俞浩自称“第一名是一种习惯”,并认为从大学至今虽遇挫折但未经历大的失败[21] 公司创业历程与技术突破 - 公司于2015年由俞浩与3人团队以10万元启动资金创立,初期专注于研发高速数字马达[25] - 创始人发现当马达转速从2万转提升至10万转时,吸力提升可达转速提升倍数的平方(即25倍),这被视为绝佳的创业机会[25][27] - 2017年,公司成功研发出10万转高速数字马达,效能达58%,超越了戴森49.8%的效能,打破了技术垄断[28] - 同年,公司加入小米生态链,并于2018年推出合作的首款小米定制吸尘器V9,6天众筹销售额突破1500万元[30] - 2020年,公司独立发展,推出自有品牌DREAME,发布搭载15万转高速数字马达的吸尘器V12,主攻高端市场,并落地苏州智能工厂实现核心部件自主生产[32] - 2025年,公司估值突破205亿元,跻身全球独角兽榜单,上半年营收已超越2024年全年[32] 公司业务多元化与生态布局 - 2025年9月19日,公司官宣进入高端智能手机与商业航天(天文业务)两大全新领域[33] - 在此之前,公司已布局潮玩品牌DREAME MART、山也觅茶奶茶店、“沸点计划火锅”、追觅咖啡DREAME CAFE等业务,其中最引人关注的是进军汽车领域[33] - 有匿名人士称,俞浩要干的事情比贾跃亭当年布局的乐视生态还要多10倍[34] - 公司多元化布局的背后是创始人“不做专才”的理念,俞浩希望将自己训练成一个“通用模型”,具备跨领域的理论迁移能力[36] - 公司文化鼓励大胆试错,组织高度扁平化,创始人直接管理诸多事业部[36] 公司的对标策略与行业定位 - 创始人俞浩经常被外界与贾跃亭比较,但他亲自回应称公司不是乐视,并指出公司在全球化(海外收入占比80%)、高端化(主业利润行业第一)和研发创新方面与乐视不同[41] - 俞浩主动对标马斯克和黄仁勋,称要打造“人类首个百万亿美金公司生态”,并认为马斯克、黄仁勋一代只能把公司市值做到8-10万亿美元[42] - 俞浩解释其高调对标是为了避免被大众拿来与小米和华为比较,并表示永远尊敬雷军、余承东、任正非等前辈企业家[42] - 2025年2月7日,俞浩公开致谢雷军和小米早期1400万元投资与订单支持,尽管小米及其关联资本已在2020年至2025年8月间陆续退出股东行列[44] - 公司战略是“对标最强大的对手”,战术上则一步步做好长期规划,寻找自身优势实现反超[44] - 当下的高调对标也被视为制造流量、进入顶级圈层的手段[45] 公司进军汽车与机器人领域 - 创始人俞浩早年创建科技组织“天空工场”,探讨飞行器、汽车和机器人,但创业时因认为无人机是小众市场而选择了清洁电器领域[46] - 公司造车计划被称为“星空计划”,于2021年秘密启动,被俞浩视为历史的必然[49] - 俞浩将企业划分为四个层级,并立志让公司从“四流”逐渐变成像特斯拉和苹果那样的“超一流”公司[49][50] - 选择汽车赛道是因为其中存在“万亿级的竞争对手”[51] - 2025年,诸多车企进军具身智能赛道,而智能汽车本质上是“有轮子的机器人”,两者共享“感知-决策-执行”的核心架构[52][53] - 公司正试图通过改装车企产品进入汽车领域,进军具身智能赛道也被视为合乎逻辑的延伸[54] - 俞浩曾表示想推动人类科技10倍进步,并认为机器人是能带来社会进步、提升生产力十倍百倍的“人类之光”方向[56]
新一代通用机器人在北京发布 操作精度控制在毫米级
新浪财经· 2026-02-10 21:53
产品发布与核心性能 - 北京人形机器人创新中心发布新一代通用机器人平台“具身天工3.0” [1] - 该机器人是行业内首个实现触物交互式全身高动态运动控制的全尺寸人形机器人 [1] - 机器人本体稳定性、运动控制、具身大小脑协同、全自主作业等方面有显著提升 [1] 硬件与本体性能 - 硬件本体预留多类型拓展接口,支持各类外设工具灵活接入 [1] - 配备高扭矩一体化关节,实现极强的肢体爆发力,可应对特种作业中高负载需求 [1] - 可稳定完成翻越约1米障碍、全身高爆发连续动作等复杂运动任务 [1] - 支持跪地作业、弯腰转身操作等复杂灵巧操控场景 [1] - 通过多自由度协同的肢体设计,将操作精度控制在毫米级 [2] 软件与生态平台 - 软件层面基于“慧思开物”平台生态,提供开发文档、工具链及低代码开发平台 [1] - 将复杂技术能力封装为简单易用的操作流程,合作伙伴无需进行底层技术重构 [1] - 支持合作伙伴根据自身场景需求开展定制化二次开发,显著降低开发门槛、缩短开发周期 [1] 应用场景与通用性 - 可快速适配特种作业、工业制造、商用服务等多元场景需求 [1] - 实现与行业主流系统的无缝衔接 [1] - 操作精度达毫米级,进一步提升通用泛化能力 [2]
逐际动力创始人张巍:不跟风、不内卷,我们在「造新物种」
36氪· 2026-02-04 21:38
行业概况与市场热度 - 2025年具身智能赛道极为火热,全年共有168家企业获得融资,融资总规模达329亿元人民币,同比大幅增长291% [3] - 资本热度延续至2026年初,仅开年一个月内,国内该领域就披露了近20起融资,其中金额达数亿人民币的融资事件屡见不鲜 [3] - 2025年,“具身智能”作为前瞻性未来产业被写入“十五五”规划建议,明确将推动其成为新的经济增长点,工信部也表示将以人形机器人为切入点带动具身智能大产业发展 [3] - 在市场繁荣的同时,行业也存在“寒冬论”与“泡沫论”的担忧,主要基于技术路线未收敛、商业路径难闭环、应用场景不明确以及企业估值高昂等问题,部分业内人士认为2026年下半年可能出现“具身智能寒冬” [3] 逐际动力公司核心动态 - 逐际动力于2026年初完成B轮融资,金额达2亿美元,是2026开年以来具身智能行业最大规模的融资,投资方包括阿联酋Stone Venture、京东、东方富海等新机构,老股东上汽、蔚来资本、明势创投等继续加码 [11] - 公司创始人张巍受邀向国务院总理李强展示了其人形机器人Oli上下楼梯的能力,直观体现了其“小脑基础模型”与“大小脑融合技术”的底层创新 [5] - 公司近期正式发布了其“具身智能体系统LimX COSA”,这是一个面向物理世界原生的Agentic OS,被比喻为人形机器人的“智能神经系统” [6][7] - 公司于去年12月发布了多形态具身机器人TRON 2,其基于同一个机器人底座,能够实现双臂、双足、双轮足三种构型的快速切换,并支持人形、四足等形态重构,旨在降低机器人场景探索的门槛 [8][11] 核心技术:COSA与TRON 2 - **COSA (Cognitive OS of Agents)**:被定义为人形机器人的Agentic OS,旨在管理机器人身上的模型、技能、记忆等,使其能在真实世界“主动思考、自主干活”,例如在演示中,机器人Oli能在任务被打断后自主判断优先级,完成取水后再去拿快递 [15][17] - **小脑基础模型**:是一种能够实时生成任意全身运动指令的模型,区别于行业常见的预编程或预先训练好的策略,是实现通用性的关键基石,支持未来视觉语言动作模型在人形机器人上的部署 [18][20][21] - **大小脑融合技术**:旨在打通导航、避障、移动操作等复杂行为与全身运控基础模型之间的对齐,是连接运动智能与认知智能的桥梁 [18] - **TRON 2的设计理念**:旨在解决探索场景成本过高的问题,通过“一个基座,多种形态”的逻辑,让用户通过更换末端执行器来适配不同场景,而无需购买多台不同类型的机器人,其负载能力强大,可实际用于工作 [22][24][25] - **创新定位**:TRON 2被视作一个由中国公司定义的全新机器人品类,即“Foundation Robot”或“通用基座”,公司强调其创新源于实际需求,旨在打破行业同质化竞争和内卷 [23][28][29] 创始人观点:行业趋势与公司战略 - **对“寒冬论”的看法**:创始人张巍不认为2026年是寒冬,反而视其为具身智能落地的元年,预计2026年将进行各种细分场景的POC验证,2027年将规模化起量,认为靠PPT融不到资是市场回归理性的表现 [4][39] - **投资逻辑变化**:观察到投资人的关注重点正从早期看技术,逐渐转向更关注场景落地和商业验证 [32] - **公司发展导向**:逐际动力定位为产品导向和商业化导向的公司,只做有商业价值、可落地的技术,创始人认为从学术导向到商业化导向需要经历四个重要转变 [33][35] - **对竞争的看法**:不认为估值高的同行带来压力,压力来自于解决用户真实需求的迫切性,认为行业仍是蓝海,关键在于解决未完成的落地问题 [36] - **对订单的看法**:更关注订单背后场景是否被验证、客户是否真的在用、能否形成复购,而非单纯宣传订单数字 [37][38] - **护城河认知**:认为最终壁垒在于产品竞争力、用户价值和市场规模,而非单纯技术,现阶段公司的技术优势包括小脑基础运动控制模型、大小脑融合技术以及本体硬件设计和制造能力 [42] - **战略选择**:公司明确其人形机器人不进工厂,口号是“Serve People, Not Process”,瞄准商业场景并最终服务于家庭,旨在帮助和增强人,而非服务生产流程 [44] - **通用机器人路径**:公司致力于通用机器人,其路径有两种:一是通过“通用本体+APP”的COSA思路,类似iPhone;二是通过TRON 2的通用基座思路,在不同功能场景中沉淀通用能力 [45][46][47] 2026年技术展望与人才观 - **关键技术变量**:创始人认为2026年具身智能实现场景化落地的两大技术变量是**第一视角视频数据训练**和**强化学习驱动的后训练**,视频数据是预训练阶段的最大变量,而具身智能正从VLA预训练转向Post-Training阶段 [49] - **后训练的重要性**:强调具身领域的后训练比大语言模型还重要,需要通过真机在真实场景中收集数据,并通过强化学习进行迭代,形成“基座模型”与“场景数据”之间的飞轮 [50] - **人才吸引与招聘**:认为吸引顶尖人才不能仅靠“堆钱”,钱是基础,但更需依靠文化、价值观、技术挑战、成长空间和成就感,招聘最看重候选人靠谱、聪明、有成长欲望、有好奇心和开放的特质 [52][53] - **中美差异判断**:认为在具身智能领域,美国没有优势,中国在从概念到产品化、量产、制造、用户、市场的长链条迭代中速度更快,凡是带硬件的领域,中国肯定跑得更快 [54] 公司目标与行业意义 - **2026年公司目标**:人形机器人的目标是去掉遥控器,完成几个场景的产品市场匹配验证,推出新品并构建有特色的产品矩阵,技术层面重点是构建具身Agentic OS,希望TRON 2能成为具身智能科研探索和场景落地的通用基座,类比英伟达的算力平台之于AI [55] - **行业定位与愿景**:公司通过全尺寸人形、通用基座、具身智能体系统等关键选择,致力于为行业开路,坚持原始创新和面向真实场景的产品开发,认为未来能留下历史意义的公司将是那些定义新范式、创造新物种的实干者 [56][57][58][59]
大事不好:机器人学会预测未来了
36氪· 2026-01-31 09:39
文章核心观点 - 蚂蚁灵波(Ant Group LingBot)开源了全球首个用于通用机器人控制的因果视频-动作世界模型LingBot-VA,该模型通过“先想象未来画面,再反推动作”的范式,显著提升了机器人在长时序、高精度及复杂任务中的自主决策与执行能力,标志着世界模型在机器人控制领域进入实际应用阶段 [1][5][6] - LingBot-VA是该公司连续第四天开源机器人关键技术组件,与之前开源的LingBot-Depth、LingBot-VLA、LingBot-World共同构成了一套完整的、推动通用机器人进入“视频时代”的技术栈,对行业技术路线产生了深远影响 [34][35][36] 技术原理与架构创新 - **核心范式转变**:模型摒弃了传统VLA(视觉-语言-动作)的“观察-反应”模式,采用“先想象世界,再反推动作”的两步策略,即通过视频世界模型预测未来视觉状态,再通过逆向动力学反推执行动作 [3][6][7] - **关键架构突破**: - 采用**视频与动作的自回归交错序列**,并引入因果注意力确保时序逻辑,借助KV-cache技术赋予模型长期记忆能力,使其能记住长任务中的历史步骤 [9] - 采用**Mixture-of-Transformers (MoT) 分工协作架构**,将视频流(负责繁重视觉推演)与动作流(负责精准运动控制)解耦,共享注意力但保持表征独立,解决了表征缠绕问题,提升了控制精度 [11][12][13][14][15] - 在工程实现上应用了**部分去噪、异步推理和FDM接地**等技术,分别提升了计算效率、降低了执行延迟,并防止模型想象脱离现实 [17][18] 性能表现与实验结果 - **真机任务测试**:模型在三大类挑战性任务中表现稳健 - **长时序任务**:如准备早餐、拆快递等多步骤任务,能稳定执行并在失败后记住进度重试 [22][23] - **高精度任务**:如清洗细小透明试管、拧螺丝等毫米级精度操作,得益于MoT架构,动作控制稳定 [5][24][25] - **可变形物体操作**:如折衣服、折裤子,能通过视频推演预判布料形变 [26][27] - **仿真基准测试成绩**: - 在**RoboTwin 2.0**双臂协作基准测试中,综合表现领先 - Easy场景平均成功率92.93%,比第二名高出4.2个百分点 [28][29] - Hard场景平均成功率91.55%,比第二名高出4.6个百分点 [28][29] - 任务序列越长、难度越高(Horizon变大),领先优势越明显,在Horizon=3的长任务中优势超过9个百分点 [29][30] - 在**LIBERO**基准测试中,以98.5%的平均成功率刷新了SOTA(State-of-the-Art)记录 [30][31] - **核心能力验证**: - **长期记忆**:在擦盘子计数等任务中,能精准记忆历史动作,避免遗忘 [31] - **少样本适应**:面对新任务,仅需约50条演示数据即可通过微调学会,数据效率极高 [32] - **强泛化能力**:对训练中未见的物体形状、颜色或摆放位置,仍能准确识别和操作 [32] 行业影响与战略意义 - **技术路线整合**:蚂蚁灵波连续四天开源的关键技术(LingBot-Depth, VLA, World, VA)形成了一条清晰完整的技术主线,分别解决了机器人“看清、连接、理解、行动”的核心问题,系统性提升了机器人在长任务、复杂场景及非结构化环境中的能力 [34][35] - **推动行业范式演进**: - 标志着**通用机器人正全面走向视频时代**,视频成为连接感知、记忆、物理和行动的统一推理媒介 [35] - 使**世界模型从可选项变为机器人中枢能力**,推动具身智能从“能动”进化到“会想再动” [36] - **引发行业连锁反应**:该系列开源动作已被海外媒体视为全球机器人领域主导权争夺的战略举措,并已引发同行跟进,如谷歌推进Project Genie、宇树科技开源UnifoLM-VLA-0等,形成了行业蝴蝶效应 [37][38]
大事不好!机器人学会预测未来了
量子位· 2026-01-30 21:34
文章核心观点 - 蚂蚁灵波开源了全球首个用于通用机器人控制的因果视频-动作世界模型LingBot-VA,该模型通过“先想象未来,再反推动作”的新范式,让机器人具备了“脑补未来”的能力,标志着世界模型首次真正应用于机器人控制闭环,是通用机器人技术的一次重大飞跃 [1][2][6][56] 技术突破与核心架构 - **范式革新**:模型打破了传统视觉-语言-动作模型的“观察-反应”条件反射模式,采用“先想象世界,再反推动作”的两步走策略,通过自回归视频预测未来几秒的视觉状态,再基于此反推动作 [4][5][6][15][16][17] - **架构设计三大突破口**: - **因果自回归序列**:将视频Token和动作Token置于同一条时间序列,并引入因果注意力确保模型仅使用过去信息,结合KV-cache技术赋予模型长期记忆能力 [20][21][22] - **混合专家分工**:采用Mixture-of-Transformers架构,让视觉流与动作流共享注意力但保持表征独立,解决了传统模型中的“表征缠绕”问题,使视觉推演与动作控制互不干扰 [24][25][26][27] - **工程优化**:通过部分去噪、异步推理和FDM接地等技术,提升了计算效率、减少了执行延迟,并防止模型想象脱离现实 [31] 性能表现与核心能力 - **真机任务测试**:模型在长时序、高精度及可变形物体操作三类挑战性任务中表现稳定,例如准备早餐、拆快递、清洗试管、拧螺丝、折叠衣物等 [33][34][35][36][37][38][39] - **仿真基准成绩优异**: - 在RoboTwin 2.0双臂协作任务中,Easy场景成功率92.93%,Hard场景成功率91.55%,分别比第二名高出4.2%和4.6%;在Horizon=3的长任务中,优势扩大至9%以上 [40][41] - 在LIBERO基准测试中,平均成功率高达98.5%,刷新了SOTA记录 [42][43] - **核心特质**:具备长期记忆、少样本适应(仅需约50条演示数据)和强大的泛化能力(可适应物体形状、颜色、位置的变化) [43] 连续开源的技术战略与行业影响 - **四天开源构成完整技术栈**:蚂蚁灵波连续四天开源的项目构成了一条清晰的技术主线,从感知、连接到理解与行动,系统性地推动通用机器人进入视频时代 [45][46][53] - Day 1: LingBot-Depth – 解决“看清”问题 - Day 2: LingBot-VLA – 解决“连接”问题 - Day 3: LingBot-World – 解决“理解”问题 - Day 4: LingBot-VA – 解决“行动”问题 - **行业价值**:为通用机器人解决长任务、复杂场景和非结构化环境等难题提供了系统性方案,使世界模型从可选项变为机器人的中枢能力 [47][48][49] - **引发行业连锁反应**:其开源动作不仅提供了可复现的技术范式,也引发了行业关注与跟进,例如谷歌的Project Genie、宇树科技的开源模型等,被视为全球机器人领域主导权争夺的战略举措 [50][51][52]