世界模型
搜索文档
SpaceX股东独家发声!合并突然且迅速,源于马斯克的巨大野心
第一财经· 2026-02-04 10:16
文章核心观点 - 埃隆·马斯克旗下SpaceX正式收购人工智能初创公司xAI,这是一次旨在整合物理与数字基础设施、构建估值可能突破1.25万亿美元超级商业实体的战略重组,意图同时吸纳太空科技与人工智能领域的资本,并为计划中的IPO创造更广阔的前景 [3][8] 合并的背景与过程 - 合并决定非常突然且迅速,此前并未向SpaceX股东透露,目前已获董事会批准 [3][6] - 合并前,SpaceX与xAI的股东存在相当程度的重合,许多投资人同时持有两家公司股份,这成为合并的重要支持基础 [7] - 此次合并与上市进程突然加速,时间相当紧凑,改变了此前关于是否让星链业务剥离或让SpaceX做更长时间上市准备的讨论 [7] 合并的战略意图与资本考量 - 马斯克希望通过合并,同时吸纳看好太空科技和看好人工智能的资本,给公司定下更广阔、多样化的前景 [3] - 合并可能意在抢在竞争对手OpenAI之前进行IPO,这不仅是商业节奏的考量,也体现了马斯克与OpenAI创始人之间的微妙竞争关系 [3][6] - 将xAI与SpaceX捆绑上市,能让xAI在上市时间线上抢得先机,并对其他冲击上市的AI对手形成打击 [8] - 若SpaceX单独上市,吸引的是太空科技资本;合并后则能一并吸纳人工智能赛道的资本,形成一场史无前例的资本“虹吸” [8] - 合并前SpaceX私募市场估值约8000亿美元,xAI在2026年1月融资时估值达2300亿美元,二者合并后直接突破1.25万亿美元,叠加IPO溢价后估值有望冲击1.5万亿美元 [9] 合并后的业务协同与叙事转变 - 合并后,SpaceX的叙事内核从“太空运输”转变为打造“地球上及地球外最具雄心、垂直整合的创新引擎”,覆盖AI、火箭、天基互联网、直连通信等 [11] - SpaceX可为仍需巨资投入研发的xAI“输血”,而xAI能为SpaceX赋予更强的AI叙事,但现阶段SpaceX对xAI的托举更多 [12][13] - SpaceX天生是一家AI原生公司,其火箭回收控制、星链卫星运行等大量依赖自动化与AI算法,它不仅是商业航天公司,更是数据的拥有者 [13] - SpaceX的单次发射成本已降至1亿美元以下,未来可能降至几千万美元,低成本发射能力为将计算设备部署到太空、实现太空算力布局提供了重要一环 [11][13] - xAI的核心方向“世界模型”需要理解物理世界规律,而SpaceX提供的火箭发射、在轨运行、太空环境等真实动态数据,可能成为训练下一代AI模型的宝贵“燃料” [13] - AI的深度嵌入有望加速火箭发射路径优化、卫星网络自主管理、太空工厂自动化等环节,实现突破性降本增效,但目前这类协同仍处于早期构想阶段 [14] 公司基本面与市场地位 - SpaceX本身盈利强劲,现金流充沛,尤其是星链业务堪称“现金奶牛”,公司早已实现盈利 [6][12] - SpaceX正在成为太空领域的“AWS”(亚马逊云服务),随着发射成本降低,卫星可能成为太空边缘计算节点,为前沿产业提供物理基础 [13] - 马斯克的操作风格是打破边界、重组叙事,此次合并类似于当年特斯拉收购SolarCity,旨在打造从能源生产、存储到消费的完整闭环 [8]
SpaceX股东独家回应:合并突然且迅速,源于马斯克的巨大野心
第一财经· 2026-02-04 09:55
交易概览与战略意图 - SpaceX宣布收购人工智能初创公司xAI,交易已获董事会批准,过程突然且迅速 [1][4] - 此次合并将公司商业版图中两大核心未上市板块整合,旨在构建一个估值可能突破1.25万亿美元的超级商业实体 [1] - 此次合并是SpaceX计划于今年进行首次公开募股前,最激进的一次资本与战略重组 [1] 交易背景与驱动因素 - 合并时机耐人寻味,当前xAI的竞争对手如OpenAI、Anthropic等AI巨头同样在冲刺上市,市场竞争已演变为资本与叙事之战 [7] - 公司创始人埃隆·马斯克或许希望抢在竞争对手OpenAI之前进行IPO,这不仅是商业节奏的考量,也涉及微妙的竞争关系 [1][5] - 合并前,SpaceX私募市场估值约8000亿美元,xAI在2026年1月融资时估值已达2300亿美元,二者合并后直接突破1.25万亿美元 [7] - 若叠加IPO溢价,新公司估值有望冲击1.5万亿美元,直接空降全球科技巨头市值前列 [7] 协同效应与战略叙事 - 合并后公司的叙事内核发生转变,旨在打造地球上及地球外最具雄心、垂直整合的创新引擎,覆盖AI、火箭、天基互联网、直连通信等 [9] - 公司预计在未来2-3年内,太空将成为生成式AI计算成本最低的场所,有必要将部分计算设备部署到太空 [9] - SpaceX可为xAI“输血”,同时xAI能为SpaceX赋予更强的AI叙事,但现阶段SpaceX对xAI的托举会更多一些 [10][11] - SpaceX提供极其稀缺的“世界数据”,如火箭发射、在轨运行等真实动态数据,可能成为训练下一代AI模型的宝贵“燃料” [11] - AI的深度嵌入将加速整个行业的智能化进程,有望在火箭发射路径优化、卫星网络自主管理等关键环节实现突破性降本增效 [12] 公司基本面与运营状况 - SpaceX本身盈利强劲,现金流充沛,尤其是星链业务堪称“现金奶牛” [10] - SpaceX的单次发射成本已经降至1亿美元以下,未来甚至可能降至几千万美金 [11] - 公司正在成为太空领域的AWS,卫星将成为太空边缘计算的节点,为太空工厂、无重力制药等前沿产业提供物理基础 [11] - 大模型竞赛仍是一场极度烧钱的游戏,xAI仍需持续投入巨资进行研发和基础设施建设 [10] 资本结构与股东情况 - SpaceX与xAI的股东存在相当程度的重合,许多同时持有两家公司股份的投资人成为此次合并的重要支持者 [6] - 公司创始人希望通过合并及未来的IPO,同时吸纳看好太空科技和看好人工智能的资本,给公司定一个更加广阔、多样化的前景 [1] - 若SpaceX单独上市,吸引的是投资太空科技的资本,而合并后能把瞄准人工智能赛道的资本也一并吸纳进来,形成一场史无前例的资本“虹吸” [7]
2026开局Update:锦秋与创业者的“全速前进”
锦秋集· 2026-02-03 18:44
锦秋基金及其被投企业动态 - 锦秋基金是一家活跃的早期科技投资机构,在2025年获得多项荣誉,包括网易新闻“2025年度人工智能活跃投资机构TOP 10”、投中网“投中2025年度中国最佳早期投资人TOP 50”等 [11] - 公司投资组合覆盖AI应用、AI硬件、具身智能/机器人等多个前沿领域,并在这些领域获得行业奖项认可 [11] - 公司旗下被投企业在2026年国际消费电子展上集体亮相,展示在机器人、人机交互及智能硬件领域的突破 [17] 视频播客栏目「锦供参考」核心观点 - 第二期探讨AI如何降低动画创作门槛,OiiOii公司构建了一套由AI编剧、分镜、音效组成的智能协作Agent系统,旨在让180万个“动画超级个体”成为可能 [1] - 第一期探讨2026年中美AI创业生态,邀请硅谷投资人及中国创业者,从硅谷VC尽调真相、非母语创业者融资攻略、OpenAI忽视的市场缝隙等角度,拆解中国创业者的定位与机会 [2] 行业交流活动「锦秋小饭桌」讨论要点 - 在CES展会期间举办近40人规模的交流活动,参与者来自AI硬件、AI Agent领域创业者及Meta、苹果、微软、字节等大厂从业者,围绕CES见闻与行业趋势交流 [3] - 以“预言2026”为主题的活动讨论了AI行业共识,包括供给侧变化、内容生产、产品护城河、定价方式、交互入口以及信任的稀缺性等话题 [5] - 活动聚焦AI应用落地的卡点与前景,汇集了AI手机、影像、浏览器、合成数据、硬件、社交等多个方向的从业者,复盘各赛道的生长阵痛与破局关键 [7] - 与Top1 AI漫剧公司的交流聚焦多模态内容,讨论指出AI漫剧正进入由投放规模驱动的大盘阶段,内容生产走向工业化,技术瓶颈在情绪表达与文戏质量,变现方式从分账与投流延展至品牌植入,并探讨低成本出海可能 [8][9] 被投企业融资与业务进展 - 人形机器人核心零部件企业**因克斯**完成近2亿元人民币新一轮融资,由华控基金、深创投集团共同领投,锦秋资本作为老股东持续追加投资,这是该公司年内完成的第三轮融资 [12] - 存算一体技术公司**铭芯启睿**完成超亿元Pre-A轮融资,由国开科创、联想创投领投,该公司此前于2025年3月完成近亿元天使轮融资,由锦秋基金领投 [12] - 世界模型与具身智能公司**Manifold AI流形空间**完成超亿元天使+轮融资,由君联资本领投,老股东锦秋基金持续加注,半年内累计已获得数亿元融资 [13] - 多智能体系统公司**atoms.dev**连续完成A轮与A+轮融资,共计3100万美元,A+轮由凯辉基金领投,锦秋基金等机构跟投 [13] - 具身智能公司**首形科技**宣布完成新一轮融资,由中网投与蚂蚁集团联合领投,这是该公司今年完成的第四轮融资 [13] 被投企业产品、技术与市场表现 - **宇树科技**2025年人形机器人出货量超5500台,根据市场推算位居行业出货量第一,其海外销售占总销量比例约为50% [14][17] - 宇树科技官宣成为“中央广播电视总台2026年春晚机器人合作伙伴”,这是其第三度与春晚结缘 [14] - **星尘智能**提出端到端全身VLA模型Lumo-1,旨在将大模型“心智”转化为机器人的丝滑操作,并与清华、港大、MIT联合提出基于对比学习的隐空间动作预训练框架,使机器人能从视频中直接学习技能 [15] - **生数科技**推出全球首个支持16秒音视频直出的多模态模型Vidu Q3,具备多镜头自由切换、多语言对话与文字渲染能力,专为漫剧、短剧、影视剧创作设计 [15] - **乐享科技**揭晓具身智能品牌Zeroth元点智能,携多款家庭机器人新品进军海外市场,聚焦提升机器人在复杂家庭环境中的移动性能、负载极限及持续交互能力 [16] - **Isoform**公司核心产品Yansu定位于“行动系统”,主张“意图即源代码”,通过AI驱动实现从“任务补全”向“产出驱动”的跨越,致力于解决复杂成熟系统中的开发与集成难题 [16][17] 被投企业在CES 2026的展示 - **宇树科技**携人形机器人H2、R1、G1及四足机器人A2、Go2等超过15台全系列产品亮相,已是第七年参展,并计划推出软件开发工具和训练平台给客户 [17] - **Zeroth元点智能**在CES期间完成全线产品的全球亮相,涵盖1.65米人形机器人Jupiter、家庭机器人M1、履带式机器人W1等多款产品 [19] - **清闲智能**在CES首秀旗舰新品“清闲动态人机工学椅生息绿限定款”,主打动态支撑技术,将于2026年1月16日开启海外预售 [19] - **庞伯特**的智能网球训练设备Pace S Pro在CES获得多项奖项,包括CES Picks奖项等,获得国际科技媒体认可 [21] - **因克斯**在CES展示20自由度等比例灵巧手EC-DexHand-5F及超小行星模组EC-A2806等机器人核心零部件新产品 [23]
AI+超算催生产业变革
中国经济网· 2026-02-02 14:57
赛事概况与规模 - 2026 ASC世界大学生超级计算机竞赛(ASC26)启动会在北京举行,总决赛将于2026年5月16日至20日在无锡学院举行 [1] - 本届大赛吸引了来自中国、美国、德国等国家和地区的超300支高校队伍报名 [1] - ASC竞赛是全球最大规模的大学生超算竞赛,已成功举办至13届,累计吸引来自全球六大洲上万名大学生参赛 [5] 赛事定位与产业意义 - 工信部官员表示,计算是信息技术核心、数字经济基石,更是培育新质生产力的关键领域,人工智能与高性能计算深度融合正催生产业变革 [1] - ASC竞赛作为全球超算竞赛,精准契合产业与人才培育需求,旨在深化产学研协同,为提升科技自主创新能力夯实人才基础 [1] - 竞赛以科技竞赛为手段、以前沿应用为导向,推动跨国界、跨地区的青年人才交流合作 [1] 赛题设置与前沿技术导向 - ASC26预赛设置了“具身智能”与“引力波数值模拟”两大前沿应用赛题 [2] - 具身智能是人工智能的前沿领域,旨在构建能够感知、推理并与物理世界交互的智能系统,人形机器人是其典型代表 [2] - 设置具身智能赛题是因为其底层核心对算力的需求远超当前主流的大语言模型,参赛学生需掌握在有限算力下进行系统级工程优化的技能 [2] - 竞赛通过引入前沿高难度赛题,着力培养青年学生定义问题、建模求解及运用AI工具解决问题的综合能力 [1] 人才培养目标与模式 - 竞赛全方位锤炼学生在硬件、中间件、软件、应用等全链条能力,塑造兼具理论与工程实践的复合型人才 [2] - 这类复合型人才是当前破解“卡脖子”技术难题、推动科技自立自强的核心力量 [2] - 高校需联合企业、行业协会,实现学科交叉知识需求与企业算力、试验资源、行业应用场景精准对接,走产教融合的人才培养之路 [3] - 超算在人工智能、宇宙探索、气象等领域作用日益凸显,社会需求旺盛,具备设立国家急需、特殊人才自设专业的潜力 [3] 合作与平台建设 - ASC人才培养合作共建计划正式启动,京港学术交流中心、北京中关村学院×中关村人工智能研究院、新加坡科技研究局高性能计算研究院等机构携手加入 [4] - 各方将共同搭建人才共建共享平台,着力培育兼具国际视野与跨界融合能力的青年科技人才 [4] - 无锡学院作为总决赛东道主,构建了以物联网、集成电路、智能制造等为引领的特色学科集群,并依托车联网产业学院等深度产教融合平台培育人才 [3]
谷歌首次开放世界模型
36氪· 2026-02-02 12:23
Project Genie产品发布与特点 - **谷歌DeepMind于北京时间1月30日凌晨向公众开放了Project Genie的实验性研究原型,这是其世界模型Genie 3首次以可交互形态对外展示** [1] - **该原型目前仅面向年满18岁的美国Google AI Ultra订阅用户开放,订阅费用为3个月125美元** [2] - **Project Genie的核心功能是“凭空造世”,用户通过文字描述或上传图片,即可在几秒钟内生成一个实时的、可交互的3D虚拟世界** [3] - **用户可以在生成的世界中像玩电子游戏一样,指挥角色自由行走、飞行或驾驶进行探索,周围环境会根据视角和行为动态、连续地生成** [3] 世界模型的技术本质与战略意义 - **世界模型的核心是模拟环境的动态变化,预测环境演化及行为对环境的影响** [4] - **Genie 3提供了前所未有的模拟能力,能生成任何现实或虚构场景的交互式环境,为机器人技术、动画制作、历史场景虚拟探索等领域提供强大工具** [4] - **Project Genie的核心价值在于为AI智能体及未来机器人提供了一个无限、安全且成本可控的“模拟训练场”和“试错沙盒”,是迈向通用人工智能(AGI)不可或缺的基石** [4] - **世界模型被视为连接当前AI与未来“具身智能”的桥梁,是让AI学会“常识”与“因果”的关键基础设施** [4] 行业竞争格局与巨头布局 - **人工智能先驱与科技巨头普遍认为世界模型对打造下一代人工智能至关重要,并有助于实现超越人类的AGI** [5] - **斯坦福大学教授李飞飞创立的世界模型初创公司World Labs正进行新一轮融资,最新估值有望达到约50亿美元** [5] - **“AI教父”杨立昆创立的AMI Labs在一轮融资中吸引了潜在支持者,该轮融资可能使其公司估值达到35亿美元** [5] - **英伟达CEO黄仁勋认为世界模型能助力实现“物理人工智能”,自主操控机器人、自动驾驶汽车等设备** [5] - **Meta的超级智能AI实验室正与机器人团队合作构建世界模型,旨在通过模拟现实世界物理规律来提升机器人的空间感知和精细操作能力** [5] 当前技术限制与挑战 - **作为初期成果,Project Genie仍不成熟,每次生成和探索的时间被严格限定在60秒以内** [5] - **生成的世界在物理效果上可能不够逼真,有时无法精确遵循提示词或现实世界的物理定律,角色操控也时常出现延迟或响应不精确的问题** [5] - **一些早期演示中提及的高级功能,如通过即时指令改变世界事件,尚未在此版本中实现** [5] - **世界模型面临巨大的计算消耗,用户每使用一次都需依赖一块专用计算芯片全功率运转,这限制了其当前的大规模应用** [6] 潜在应用领域与行业影响 - **谷歌DeepMind、World Labs等领先AI团队认为,世界模型可能会首先重塑游戏和影视行业** [7] - **该技术可将3D资产创建、场景搭建、概念设计及动态分镜预览等过程,从传统的人力与时间密集型环节压缩至几分钟甚至几秒钟,极大释放创意验证速度** [7] - **DeepMind世界模型项目负责人预计,游戏开发在未来几年可能发生彻底性变化** [7] - **World Labs已推出其首款商业产品、由生成式AI驱动的三维世界生成系统Marble,并认为这将颠覆Unity和Epic旗下Unreal等游戏引擎** [7] - **除了游戏领域,xAI、英伟达等公司也希望将世界模型嵌入机器人和自动驾驶汽车中** [7]
未知机构:Genie3真的利空游戏吗-20260202
未知机构· 2026-02-02 10:00
纪要涉及的行业或公司 * **行业**:游戏产业链、人工智能(AI)生成内容(AIGC)、世界模型 * **公司**: * **美股公司**:Unity(引擎+广告)、Roblox(UGC平台)、Take-Two(研发商)、奈飞(Netflix) * **A股/港股公司**:昆仑万维、视觉中国、完美世界、巨人网络、世纪华通、恺英网络、腾讯、心动公司、百奥家庭互动、丝路视觉、凡拓数创、风语筑 * **其他**:谷歌(发布Genie3)、生数科技(视觉中国战投)、光厂创意(视觉中国3D素材) 核心观点与论据 * **市场短期反应与长期趋势**:谷歌公测世界模型Genie3后,美股游戏产业链公司股价大跌(Unity -24%、Roblox -13%、Take-Two -8%),市场交易“AI颠覆游戏产业链”的叙事[1] 但核心观点认为,这短期是市场对“模型应用”的演绎,长期来看是产业生产力的升级,而非颠覆[1] * **Genie3的定位与局限性**: * Genie3定义了一种新的可交互内容形式(让用户“走进图片”),但很难称之为真正的游戏[1] * 游戏的核心是可玩性、玩法机制及系统化的商业工程(包括社区运营、活动运营、商业化体系等),Genie3目前的能力在现有游戏工业中直接制作游戏的可能性非常低[2] * **Genie3对产业的潜在影响**: * **正面影响**:可能优化游戏立项流程,大幅提升关卡设计等环节的验证效率,从而利好游戏制作[2] * **类比分析**:类似短视频并未颠覆电影/电视剧,中国电影票房从12、13年的200亿不到增长至现在的500多亿,抖音起量的2019年甚至达到640亿以上,奈飞市值也提升了数倍[3] 短视频(如切片)反而可能成为电影等内容的重要传播形式[4] 其他重要内容(投资建议与标的) * **投资方向一:世界模型资产**:关注昆仑万维(开源MatrixGame 2.0世界模型)、视觉中国(战投生数科技+光厂创意3D素材)等[5] * **投资方向二:游戏板块**:认为不宜过度担忧,继续看好,后续关注春节假期前后商业化高度[5] * **具体标的**:完美世界(2月4日《异环》三测开启)、巨人网络(《超自然行动组》DAU 1000W+,春节前商业化)、世纪华通(业绩超预期+多款产品测试中)、恺英网络(参投《自然选择》储备AI社交产品)[5] * **港股推荐**:腾讯(混元世界模型)、心动公司(Tap maker和Tap PC期权)、百奥家庭互动(储备《夜幕之下》)[5] * **投资方向三:3D资产相关公司**:丝路视觉、凡拓数创、风语筑等[5]
UnitedHealth, Trade Desk, And Unity Are Among Top 10 Large Cap Losers Last Week (Jan. 26-Jan. 30): Are the Others in Your Portfolio? - First Majestic Silver (NYSE:AG), Axon Enterprise (NASDAQ:AXON), C
Benzinga· 2026-02-02 03:31
文章核心观点 - 上周有十只大盘股表现最差 其股价下跌由公司特定事件 行业动态及宏观经济因素共同驱动 [1][2][3] 公司股价表现及原因 - Unity Software Inc (U) 股价本周下跌31.63% 此前公司CEO在社交媒体上发布关于公司和“世界模型”的帖子 股价也可能受到谷歌Project Genie新闻的影响 这可能冲击游戏公司 [1] - Hecla Mining Company (HL) 股价本周下跌33.33% 此前特朗普总统提名凯文·沃什为美联储主席 提名推高了美元价值 可能缓解了投资者对避险资产的追逐 [2] - Humana Inc (HUM) 股价本周下跌26.07% [2] - Coeur Mining, Inc (CDE) 股价本周下跌26.13% [2] - Axon Enterprise, Inc (AXON) 股价本周下跌20.88% [2] - Regencell Bioscience Holdings Limited (RGC) 股价本周下跌13.38% [3] - UnitedHealth Group Incorporated (UNH) 股价本周下跌17.87% 此前多家分析机构下调了其目标价 [3] - First Majestic Silver Corp (AG) 股价本周下跌22.86% [3] - The Trade Desk, Inc (TTD) 股价本周下跌16.61% 此前多家分析机构下调了其目标价 [3] 行业及宏观影响因素 - 贵金属类股票走低 与美元因美联储主席提名事件走强有关 [2] - 谷歌的Project Genie可能对游戏公司产生影响 [1]
蚂蚁开源世界模型叫板谷歌Genie3,一张图生成10分钟稳定长视频
搜狐财经· 2026-02-01 03:37
公司动态与产品发布 - 蚂蚁灵波科技于1月29日发布并开源了专为交互式世界模型设计的开源框架“LingBot-World”,其核心LingBot-World-Base能够提供高保真、可控制且逻辑一致的模拟环境 [1] - 该模型由一个可扩展数据引擎驱动,通过从大规模游戏环境中学习物理规律与因果关系,实现与生成世界的实时交互 [2] - 蚂蚁已连续发布三款“灵波”系列具身领域大模型,其通用人工智能战略完成了从数字世界向物理感知层面的关键延伸,使其“基础模型 – 通用应用 – 实体交互”的全栈技术路径进一步清晰 [5] 产品核心技术指标 - 在视频质量、动态程度、长时一致性、交互能力等关键指标上,LingBot-World均逼近谷歌Genie 3 [2] - 通过多阶段训练与并行化加速,模型实现了近10分钟的连续稳定无损生成,解决了长序列生成中的“长时漂移”问题 [3] - 在交互性能上,模型可实现约16 FPS的生成吞吐,并将端到端交互延迟控制在1秒以内,用户可通过键盘或鼠标实时控制角色与相机视角 [3] 产品核心功能与优势 - 模型具备长时序一致性,在镜头最长移开60秒后返回,目标物体仍存在且结构一致 [3] - 用户可通过文本指令触发环境变化与世界事件,如调整天气、切换画面风格或生成特定事件,且所有变化均可在保持场景几何关系相对稳定的前提下完成 [4] - 模型具备良好的Zero-shot泛化能力,仅需输入一张真实的城市街景照片或游戏截图,即可生成对应的可交互视频流,无需针对单一场景进行额外训练 [4] - 模型支持场景多样化生成,可以改变光照、摆放位置变化等,有助于提升具身智能算法在真实场景中的泛化能力 [5] 数据与训练方法 - 为解决高质量交互数据匮乏的问题,模型采用了混合采集策略:一方面清洗大规模网络视频以覆盖多样化场景,另一方面结合游戏采集与虚幻引擎合成管线,从渲染层直接提取无UI干扰的纯净画面,并同步记录操作指令与相机位姿 [4] 行业意义与应用潜力 - 世界模型正成为连接生成式AI与具身智能的关键桥梁 [5] - LingBot-World凭借长时序一致性、实时交互响应及对“动作-环境变化”因果关系的理解,能够在数字世界中“想象”物理世界,为智能体的场景理解和长程任务执行提供了一个低成本、高保真的试错空间 [5] - 模型在长序列生成与零样本泛化方面的能力,若能在实际应用中验证,或可推动相关领域从有限场景训练向开放场景适应的演进 [5]
大事不好!机器人学会预测未来了
量子位· 2026-01-30 21:34
文章核心观点 - 蚂蚁灵波开源了全球首个用于通用机器人控制的因果视频-动作世界模型LingBot-VA,该模型通过“先想象未来,再反推动作”的新范式,让机器人具备了“脑补未来”的能力,标志着世界模型首次真正应用于机器人控制闭环,是通用机器人技术的一次重大飞跃 [1][2][6][56] 技术突破与核心架构 - **范式革新**:模型打破了传统视觉-语言-动作模型的“观察-反应”条件反射模式,采用“先想象世界,再反推动作”的两步走策略,通过自回归视频预测未来几秒的视觉状态,再基于此反推动作 [4][5][6][15][16][17] - **架构设计三大突破口**: - **因果自回归序列**:将视频Token和动作Token置于同一条时间序列,并引入因果注意力确保模型仅使用过去信息,结合KV-cache技术赋予模型长期记忆能力 [20][21][22] - **混合专家分工**:采用Mixture-of-Transformers架构,让视觉流与动作流共享注意力但保持表征独立,解决了传统模型中的“表征缠绕”问题,使视觉推演与动作控制互不干扰 [24][25][26][27] - **工程优化**:通过部分去噪、异步推理和FDM接地等技术,提升了计算效率、减少了执行延迟,并防止模型想象脱离现实 [31] 性能表现与核心能力 - **真机任务测试**:模型在长时序、高精度及可变形物体操作三类挑战性任务中表现稳定,例如准备早餐、拆快递、清洗试管、拧螺丝、折叠衣物等 [33][34][35][36][37][38][39] - **仿真基准成绩优异**: - 在RoboTwin 2.0双臂协作任务中,Easy场景成功率92.93%,Hard场景成功率91.55%,分别比第二名高出4.2%和4.6%;在Horizon=3的长任务中,优势扩大至9%以上 [40][41] - 在LIBERO基准测试中,平均成功率高达98.5%,刷新了SOTA记录 [42][43] - **核心特质**:具备长期记忆、少样本适应(仅需约50条演示数据)和强大的泛化能力(可适应物体形状、颜色、位置的变化) [43] 连续开源的技术战略与行业影响 - **四天开源构成完整技术栈**:蚂蚁灵波连续四天开源的项目构成了一条清晰的技术主线,从感知、连接到理解与行动,系统性地推动通用机器人进入视频时代 [45][46][53] - Day 1: LingBot-Depth – 解决“看清”问题 - Day 2: LingBot-VLA – 解决“连接”问题 - Day 3: LingBot-World – 解决“理解”问题 - Day 4: LingBot-VA – 解决“行动”问题 - **行业价值**:为通用机器人解决长任务、复杂场景和非结构化环境等难题提供了系统性方案,使世界模型从可选项变为机器人的中枢能力 [47][48][49] - **引发行业连锁反应**:其开源动作不仅提供了可复现的技术范式,也引发了行业关注与跟进,例如谷歌的Project Genie、宇树科技的开源模型等,被视为全球机器人领域主导权争夺的战略举措 [50][51][52]
2026年具身智能产业发展研究报告丨36氪研究院
36氪· 2026-01-30 18:24
中国具身智能产业发展概况 - 产业在政策、技术、需求与资本共振下进入快速发展新阶段,资本市场布局活跃,2025年前11个月融资额达334.73亿元,是2024年同期的4倍,全年融资事件超305起,总额超380亿元,参与投资机构超600家 [5][40] - 社会经济发展中涌现出明确的替代需求,人口老龄化与劳动力结构性短缺问题凸显,推动对能替代人工、承担高风险任务并提升产线效率的智能化解决方案的需求,传统自动化设备难以适应动态复杂环境,以人形机器人为代表的具身智能正加速演进,形成“感知-认知-决策-执行”完整技术闭环并走向规模化量产 [6] - 中国具身智能产业凭借技术成熟度、产业链完备度与市场拓展速度,已处于全球第一梯队,国内领军企业已完成从原型开发到规模化量产的工程验证,产业链具备明显成本优势和本地配套能力,关键零部件供应商数量远多于美国,使得整机成本可控制在海外同类产品的约50% [7][8] - 根据36氪研究院测算,中国具身智能市场规模已从2018年的2,133亿元迅速增长至2025年的9,150亿元,并有望在2026年突破万亿元关口 [8][38] 产业核心驱动力 - **政策驱动**:已形成国家顶层设计引领、部委专项政策支持、地方创新实践落地的多层次推进格局,2025年首次被写入《政府工作报告》并纳入“十五五”规划建议的未来产业体系 [30][31] - **技术驱动**:依托大模型、多模态融合与仿真训练等基础技术的系统性突破,大模型为具身智能提供通用认知与任务规划能力,推动机器人进入开放、动态的复杂物理环境 [33] - **需求驱动**:主要受生产力结构性短缺、公共服务长期存在缺口等社会现实因素驱动,劳动力结构性短缺与成本上升催生替代需求,养老护理等公共服务体系面临长期供需缺口,产业链对高效率、低损耗的连续作业需求不断提高 [34][35] - **资本驱动**:成为资本市场最受关注的战略性赛道之一,融资规模呈爆发式增长,投资呈现出以产业资本(CVC)为核心、各类资金功能清晰、协同推进的布局特征 [40] 技术演进与产业链构建 - **上游技术基石**:涵盖核心硬件组件与软件算法体系,AI大模型正成为驱动上游发展的关键力量,推动具身智能向具备高阶认知能力的完整闭环演进,技术路径呈现从专用小模型向“通用大模型+垂直场景微调”方向演进的趋势 [33][47][50] - **运动控制瓶颈**:上游硬件生态的标准化缺失与运动控制技术的成熟度不足,共同构成制约产品高效集成的核心技术瓶颈,行业正从硬件标准化和软件生态化两个方向积极推动 [51][52][53] - **人形机器人技术构成与成本**:本体可分为大脑(决策交互)、小脑(运动控制)和肢体(感知执行)三部分,一台功能完备的人形机器人成本中,执行器和传感器合计占比60%以上 [54][56][57] - **核心零部件国产化**:国产化程度分化明显,结构件已实现近全国产化,电池、控制器等部件国产化率较高,但力传感器、丝杠等高端部件国产化率偏低,对进口依赖程度较高,是产业降本与实现供应链自主可控的主要瓶颈 [58][59][60] 人形机器人发展现状 - **发展阶段**:作为具身智能的主要载体,产业将在2026年迈入规模化放量的关键阶段,产品价格持续下探,十万台级别的量产规模可期 [10][67] - **量产与成本**:2025年被认为是量产元年,国内出货量达1.8万台,同比增超650%,2026年有望提升至6.25万至20万台,成本下行是直接驱动因素,部分机型起售价已降至万元级别 [38][67][69] - **商业化落地**:商业化节奏日趋加快,工业领域成为商业化扩张的关键一步,已开始收获千台级别的商业化订单或明确意向,主要探索场景集中于工业巡检与物流、商业服务与导览、家庭陪伴与护理 [70][73] - **技术突破口**:产业发展的核心突破口在于机器人大脑的演进,尤其是“世界模型”(空间大模型)的技术突破,以解决机器人三维空间动作复杂度高、缺乏空间智能的根本瓶颈 [10][74][77] 下游应用场景渗透 - **工业领域**:应用核心已从传统自动化转向支持柔性制造与自主决策,在汽车制造、电子电气和金属加工等场景加速落地,2024年汽车及零部件为最大应用领域,占比43.3% [13][81][82] - **服务领域**:基本实现场景全覆盖,具有场景细分精准化、交互体验拟人化、产品形态轻量化与创新化三大共性特点,覆盖商业服务、家庭陪伴、公共服务与情感交互 [13][83][86] - **特种领域**:聚焦极端环境下的任务闭环作业,适配能力持续增强,已在灾害救援、能源巡检、高危维护、核电维护、太空探索等场景实现关键突破 [13][87] - **交通出行领域**:发展重心正从单一载具自动化迈向系统级协同与立体化生态构建,聚焦自动驾驶、智能补能及低空出行三大方向,推动城市交通向“地下-地面-低空”多层级融合演进 [13][88][89] 未来竞争格局与趋势 - **市场格局**:产业将呈现多层次的市场格局,场景落地将沿技术成熟度与环境复杂度逐级展开,市场竞争将升级为技术底座、盈利能力与供应链体系等生态层面的综合较量 [15][23] - **技术产品体系演进**:将在世界模型、数据闭环与协作机制的驱动下,转化为可规模部署的通用劳动力,其迈向通用劳动力的核心支撑在于空间智能等关键技术的突破 [15][23][77] - **生态协同**:未来将实现从技术闭环向生态协同的跨越,头部企业从单一产品供应转向开放生态构建,通过合作开发垂直场景解决方案加速技术落地 [15][82]