世界模型
搜索文档
李飞飞World Labs最新判断:AI写完代码,下一步是「写世界」?
机器之心· 2026-03-04 17:15
文章核心观点 - AI在空间创作和现实世界任务中需要一种类似“代码”的通用接口,而3D作为一种结构化的表达方式,正扮演着这个角色,它能够被生成、检查、修改、版本管理,并接入模拟与机器人系统[2] - 将3D比作代码,神经图形学比作编程语言,模拟引擎比作芯片,共同构成一个支持可编程、数据驱动空间系统的新架构栈,以实现人、智能体与软件之间的可靠沟通与协作[9][11][13][23] 3D作为通用接口的类比与优势 - 3D与代码在作为接口上具有关键的结构相似性,都能将状态外化为其他系统可用的结构化构件,从而实现推理、表示和执行的分离[3][6] - 与让大语言模型直接“成为程序”或依赖黑盒系统相比,使用结构化的3D表示能提供可操作的结构,其输出可被检查、编辑、共享并集成到现有系统中[6][7] - 3D作为接口,对人而言自然且高效,因为人类的思维围绕持久物体构建,3D编辑一次即可自动传播到所有渲染帧,这与代码只需修改一次源代码而非重写每个输出的逻辑一致[19][20] 技术驱动与神经图形学的作用 - 为机器学习优化的现代GPU硬件,拥有庞大的内存,打破了传统3D引擎在内存和计算上的限制,使得NeRF和高斯泼溅等消耗大量资源的技术得以实现,支持生成和渲染世界级规模的表示[9][10] - 神经图形学在此架构栈中扮演着类似编程语言的角色,提供了一种表现力丰富的媒介,用于描述和生成空间结构[11] - 具体技术应用包括:Marble多模态世界模型可从多种输入创建持久、可导航的3D世界并导出为高斯泼溅、网格或视频;Chisel功能允许通过粗粒度3D布局控制生成细节;RTFM实验从简单输入生成复杂视觉效果;Spark则是集成WebGL的高性能高斯泼溅渲染器[25] 模拟引擎与系统架构的重要性 - 模拟引擎是运行“3D代码”的“芯片”,它解决状态管理、物理机制、碰撞检测等系统问题,使世界模型在时间维度上实现交互、持久性和动态变化[13][14] - 完全端到端的“像素化”方法将状态、动态和渲染纠缠在单一网络中,虽然方便,但会削弱物理一致性、可回放性和确定性的保证[14] - 更可行的方案是采用因式分解或混合运行时架构,让学习到的世界模型生成结构化3D表示,同时利用外部工具和引擎组件,在感知、生成组件与需要严格规则的组件之间保持区分[15][16] 3D作为人机与机机接口的价值 - 对于机器,3D是自然通用语,能使世界模型输出直接接入现有的模拟器、机器人软件栈、CAD等工具链,并促进机器间高效交流空间意图[17][18] - 结构化的3D输出使得空间意图(如目标区域、禁区标记)能够被清晰传达,这比共享隐向量或使用低效的语言格式更为可靠[18] - 3D表示的可导出能力至关重要,它将模型的“思想”外化为具体表示,使其成为可检查、验证、版本控制、测试和重用的构件,从而支持可组合的流水线[18]
何小鹏赌约背后,中美智驾只剩“一年之差”
汽车商业评论· 2026-03-04 07:04
文章核心观点 - 自动驾驶行业在2025至2026年经历技术路线分化,从纯端到端模型转向以VLA(视觉-语言-动作)模型为代表的“认知智能”路线,旨在解决长尾场景难题并打通L2至L4的商业闭环 [6][7][27] - VLA架构通过在视觉与动作间插入语言模型,赋予车辆基于常识的逻辑推理能力,实现从“直觉驾驶”到“认知驾驶”的跃升,成为中美头部车企及供应商竞相布局的技术方向 [19][22][28] - 行业在“端到端”共识下分化出VLA派、世界模型派和一段式强化学习端到端派三条主要技术路线,各方围绕体验、安全与成本进行博弈,并呈现融合进化趋势 [33][49][50] - 2026年成为自动驾驶落地关键年,竞争焦点从算法代差转向工程落地效率、数据闭环转速及资源整合能力,中国车企凭借复杂场景优势与特斯拉FSD展开正面竞争 [61][70][74] 自动驾驶行业技术演进与瓶颈 - 特斯拉FSD V12在2023年以端到端“直觉驾驶”震惊行业,代码量从30万行锐减至2000行,但后续版本暴露了其在长尾场景中缺乏可解释性和逻辑推演能力的根本缺陷 [11] - 纯端到端模型本质是概率拟合器,面对未见过的场景时决策如同“黑箱”,成为横亘在L2与L4之间的天堑,行业陷入“直觉陷阱” [11][12] - 为解决上述瓶颈,行业集体转向探索为车辆植入“认知”能力,VLA多模态架构因能引入常识推理而被重新发掘价值 [15] VLA(视觉-语言-动作)模型的核心价值与行业转向 - VLA在视觉与动作间插入语言模型,使系统能像人类一样进行“预判与经验”式逻辑推演,而非单纯依赖数据拟合,从而处理未见过的长尾场景 [19][22] - 技术优势在于提升模型可解释性,用逻辑能力弥补极端数据不足,在算力与数据边界下成为体验跃迁的捷径 [24] - 商业价值在于打破L2与L4的割裂,一套具备认知能力的模型可同时覆盖量产车和Robotaxi,有望“通吃”多个万亿级市场,降低研发沉没成本并使L4落地时间表更清晰 [26][27] - 中美头部玩家如特斯拉、小鹏、理想基于技术质变与商业落地倒逼,在2025年后默契地集体转向VLA路线 [17][19][28] 主要技术路线分化与博弈 - **VLA派**:以元戎启行、理想、小鹏为代表,主张通过语言常识赋予车辆泛化能力,方案具有高拟人度和可解释性,并能依托主机厂用户基盘形成数据飞轮效应 [33][34][37] - **世界模型派**:以华为、蔚来为代表,主张构建可计算的物理引擎(如WA/WEWA架构),让系统“先理解世界,再作出决策”,追求基于物理规律的因果推演和终极安全,但训练成本极高 [33][42][43][45] - **一段式强化学习端到端派**:以Momenta、地平线为代表,追求极致的“黑盒”直觉,通过海量数据与强化学习建立从感知到动作的直接映射,在覆盖多价位车型时展现出高泛化能力和成本优势,Momenta在2025年拿下第三方供应商61.06%的份额 [33][46][47][49] - 三条路线的本质是时间与空间的置换:VLA追求短期体验极致,世界模型追求终极安全,一段式端到端追求当下利益最大化,未来趋势是三者“融合进化” [49][50][51] 2026年行业竞争格局与落地挑战 - 行业进入规模战,2025年前11个月中国配备城市NOA功能的乘用车销量达312.9万辆,渗透率15.1%,预计2026年具备高阶自动驾驶能力的车型年销量有望冲击500万台量级 [61][62] - 竞争焦点转向工程落地效率与数据闭环转速,自研门槛因AI大模型被无限拔高,仅训练VLA模型所需的算力卡采购每年就高达数亿元 [63][64] - 供应商方案价值凸显,如华为、Momenta、地平线、元戎启行等通过工程优化将高阶智驾打入15万甚至更低价位车型,同时国际巨头如英伟达通过开源Alpamayo 1 VLA模型锁定算力生态 [66][68] - 车企策略分化:头部新势力与华为系坚持全栈自研构建壁垒;传统转型车企与新品牌多选择采购供应商方案并联合调优的“强强联合”模式 [70] 中美自动驾驶竞赛与未来展望 - 特斯拉FSD入华提速,满血版最早于2026年2月获中国监管批准,将全球竞赛从隔空较量变为中国市场的贴身肉搏 [72][73] - 中国头部玩家认为技术路线已回归同一起跑线,与特斯拉的差距从三年缩短至一年,竞争核心转为工程落地与数据闭环效率 [74] - 中国复杂的交通场景为训练VLA的语言推理能力提供天然沃土,小鹏汽车发布第二代VLA,称其响应延迟率降低80%,推理效率提升12倍,综合行车效率提升23%,并喊话欢迎与FSD对比 [53][76][77] - 行业激进预判完全自动驾驶将在未来1-3年内到来,最终胜负在于谁能在复杂场景中定义终局 [79][80]
中山大学HCP Lab联合拓元智慧提出高效世界模型DDP-WM,机器人规划效率提升9倍
机器之心· 2026-03-03 16:14
行业技术背景与挑战 - 基于预训练视觉表征构建世界模型是具身智能领域的前沿方向,以DINO-WM为代表的模型能精确捕捉物理动态并具备零样本规划能力 [2] - 现有密集计算范式对所有图像块应用自注意力,不区分运动物体与静态背景,导致计算开销高昂,决策速度成为实际部署的重大挑战 [2] - 在处理Push-T等典型操作任务时,DINO-WM的模型预测控制单个决策循环耗时高达两分钟,这种延迟无法满足现实场景持续高频交互的需求,阻碍了机器人低成本端侧部署 [2] DDP-WM核心创新与设计理念 - 中山大学HCP Lab与拓元智慧X-Era AI提出新型高效世界模型框架DDP-WM,其核心思想是解耦动态预测,将计算资源精确分配给场景中不同属性的动态特性 [3] - 该框架源于对现有密集模型工作模式的洞察:大多数物理交互中,实际发生变化的区域面积占比很小,大量计算浪费在对静态背景的无效重复计算上 [4] - 研究发现,物理世界中稀疏的运动动态反映在特征层面是高度稀疏且结构化的,相邻帧特征图相减后只有极小部分特征有显著变化 [7] - DDP-WM将观测场景的潜在状态演化分解为两种动态:稀疏的主动态(由物理交互引起)和上下文驱动的背景更新(由主动态引发) [9] DDP-WM架构与核心模块 - 预测过程首先通过高效的历史信息融合模块,将速度、加速度等高阶动态信息注入当前帧特征,为精确预测提供上下文 [12] - 动态定位网络通过轻量级ViT识别下一帧中稀疏的主动态区域,输出二值掩码以引导计算资源 [13] - 稀疏主动态预测器使用多层ViT架构,但仅对动态定位网络识别出的稀疏前景特征子集进行计算,避免了在静态背景上的计算浪费 [14] - 低秩校正模块通过单向交叉注意力机制,允许背景特征以前景特征为指导进行低成本微调,确保特征空间演化的一致性和平滑性 [15] 实验验证:性能与效率 - 在五个仿真环境(PointMaze、Wall、Push-T、Rope、Granular)的实验中,DDP-WM在所有任务上的规划性能均达到或超过当前最先进的密集世界模型DINO-WM [17] - 在Push-T任务中,DDP-WM的MPC成功率达到98%,显著优于DINO-WM的90% [18] - 在PointMaze和Wall导航任务中,DDP-WM分别取得了100%和98%的高成功率 [18] - 在复杂的绳索和颗粒任务中,DDP-WM取得了最低的倒角距离,展现了其理解高自由度非刚体变形和复杂多体动力学的能力 [19] - 在Push-T任务中,DDP-WM的单步前向推理FLOPs为2.5G,仅为DINO-WM(23G)的约10.8%,理论计算成本大幅降低 [21] - DDP-WM在Push-T任务上实现了每秒1563个样本的推理吞吐量,相比DINO-WM提升了9.2倍 [21] - 在需要30次CEM迭代的Push-T任务中,DDP-WM的单次决策时间从DINO-WM的两分钟缩短至16秒,实现了9倍的规划速度提升 [3][21] 消融分析与技术洞察 - 消融实验表明,移除低秩校正模块后,虽然开环预测仍能保持高保真建模,但模型的MPC成功率从98%急剧下降到70% [22] - 移除LRM的模型生成的代价地形崎岖不平、噪声大,导致基于采样的优化器无法找到有效下降方向 [25] - 带有LRM的DDP-WM模型生成的代价地形平滑且具有明显的漏斗状宏观结构,为优化算法提供了清晰的引力井 [25] - 分析证实,真实特征图的更新过程本质上是低秩的,而LRM模块成功学习并复现了这种低秩结构 [26] 行业意义与展望 - DDP-WM的成功表明,通过对潜在空间运动模式的洞察进行针对性结构设计,可以在不牺牲甚至超越现有SOTA性能的前提下,显著提高世界模型的预测速度 [30] - 该工作将计算资源依赖降低了一个数量级,使得在更轻量级的边缘硬件上部署高频、复杂规划模型成为可能 [30] - 这项研究为在工业生产和家政服务等实际场景中部署先进的自主机器人铺平了道路,对推动具身智能走向实际应用有重大意义 [30]
何小鹏:小鹏第二代VLA开启自动驾驶DeepSeek时刻;知情人士:鸿蒙智行已对违规营销门店进行处罚丨汽车交通日报
创业邦· 2026-03-02 18:05
鸿蒙智行营销管理事件 - 鸿蒙智行对部分门店的违规营销行为进行了处罚 处罚措施包括责令限期整改、扣除绩效分数及门店激励、要求经销商对责任人进行经济处罚及问责 [2] - 涉事的两家鸿蒙智行门店已发布道歉声明 承认在营销视频中使用加速或倒放视频素材等违规行为并接受批评 [2] 小马智行Robotaxi运营进展 - 小马智行宣布其第七代Robotaxi于2026年2月在深圳实现月度单车运营盈利转正 [2] - 截至2026年2月28日 该车型当月单车单日平均净收入达到338元 单车日均订单量达23单 [2] 滴滴自动驾驶技术研发合作 - 滴滴自动驾驶成立深穹远航实验室 并与清华大学李升波教授课题组达成产学研深度融合专项合作 [3] - 合作将聚焦多模态大模型、世界模型、强化学习等前沿方向 共同推动多模态端到端自动驾驶技术突破与产业落地 [3] - 实验室采用“实体运营+资源共用+联合攻关”模式 旨在打造“研究-工程-商业”产学研合作新范式 并通过联合培养机制塑造AI领域高端人才 [3] 小鹏汽车自动驾驶技术发布 - 小鹏汽车发布第二代VLA智驾系统 公司董事长何小鹏称其开启自动驾驶的“DeepSeek时刻” 并表示这是面向完全自动驾驶的第一个版本 将以前所未有的速度迭代 [4] - 公司宣布将于3月11日在全国732家门店开启第二代VLA的试驾 [4] - 公司计划启动从喀什到上海长达5000公里的智驾横穿中国计划 同时搭载第二代VLA的Robotaxi也已开启公开道路测试 [4]
对话九合王啸:90%具身智能公司没未来,市场名额只有三五家
量子位· 2026-03-02 17:09
文章核心观点 - 资深投资人王啸基于其技术背景与早期投资经验,对具身智能赛道进行了深入分析,认为该赛道是继汽车之后的下一个巨大终端机会,尽管存在估值泡沫,但泡沫是行业发展的必然阶段并有助于推动进步 [4][5][38][32] - 投资策略强调“模糊的正确”,即在早期投资中把握技术演进的大趋势和“大故事”,而非过度钻研技术细节,并需要在商业化程度、技术先进性和估值之间做出取舍 [12][77][78] - 行业最终将经历大浪淘沙,当前上百家公司中可能仅存活三五家,成功的关键在于实现场景闭环、强大的资本运作以及成本控制 [41][42][46][52] - 从长期市场空间看,To C端潜力远大于To B端,类比个人电脑和手机的发展路径,当人形机器人价格降至2万元并胜任家务时,将引爆近5亿家庭的巨大市场 [48][50][51] - 基金管理方面,面对募资环境从美元主导向人民币、国资主导的转变,需要坚守LP多元化,并控制基金规模以保持收益能力,拒绝返投难度过大的资金 [16][90][94][97] 具身智能行业现状与趋势 - 行业在2026年初涌入大量热钱,但专业投资人稀缺 [1][2] - 行业被普遍视为继汽车之后最大的终端机会之一,是硬件、软件与场景适配的结合 [38] - 当前发展阶段尚未达到移动互联网早期的疯狂程度,因为硬件属性不同,且融资与补贴规模不及当时 [40] - 行业存在大量创业公司,预计最终仅会存活三五家,淘汰率极高 [41][42] - 行业出现股改与筹备上市潮,上市能为一级市场的梦想提供变现通道,并形成正反馈推动中国科技领域发展 [34] 市场空间与商业化路径 - To C市场的长期空间远大于To B市场,核心逻辑在于终端数量级差异,参考个人电脑和手机的发展历史 [48][49][50] - 中国有近5亿家庭,若人形机器人价格降至2万元且功能适用,即使仅10%的渗透率也能带来5000万台的市场规模 [51] - 现阶段To B端因客单价高(如20万元)而显得市场更大,但这是短期现象 [50] - 实现场景闭环对公司的成功至关重要,需要同时在技术、产品和资本运作上表现强劲 [46] - 云端算力是支撑机器人“大脑”的刚需基础设施,未来市场格局将是少数几家头部厂商共存 [55] 技术发展与竞争门槛 - 单纯机器人硬件的制造门槛因算法开源而降低,但实现量产、多场景适配、低成本与高安全性仍是巨大挑战 [52] - “世界模型”的研发是当前关键但未解决的难题,现有尝试多基于Transformer架构套用,尚未找到清晰有效的技术路线 [60][61] - 技术路线存在争议,投资机构需在大方向正确的前提下,于不同技术路线(如本体、大脑、VLA、世界模型)进行多元下注 [85] - 从灵巧手等零部件起步是可能的差异化竞争路径,但长期看可能仍需向本体发展,且作为零部件议价能力有限 [54] - 有价值的数据获取依赖于拥有规模化、低成本的To C硬件产品,单纯做数据标注服务的公司壁垒低,难以做大 [56][57][58] 投资策略与哲学 - 早期投资追求“模糊的正确”,关键在于判断技术演进的大趋势,而非像专家一样深究细节 [12] - 投资决策优先级排序为:具有“大故事”(大需求、大想象空间)、拥有优秀团队、以及处于合理的进入“时间窗口” [79][80][81] - 一个赛道的投资时间窗口通常不超过半年到一年,例如投资具身智能本体的最佳窗口在2023年至2024年上半年 [81] - 允许早期项目存在估值溢价,但需可控,后期估值泡沫(如上千倍PS)则难以持续 [33] - 投资组合的成功依赖于团队水平和方法论,单个项目的成败则包含运气成分 [88] 创业者与团队特质 - 成功的创始人需有强大的内在动力,愿意持续努力并改变自己,避免“小富即安”的心态 [70][73] - 具身智能赛道创业者年轻化(00后、95后),他们勇敢、认知迭代快,且需要有“大梦想”来支撑长远发展 [67][69] - 考察创业者时,需关注其学习能力、改变意愿以及是否过于自我 [31] - 团队和创始人处于动态变化中,仅通过数次见面难以完全了解,需要持续锻炼判断力 [76] 估值与泡沫 - 风险投资本质是用当前估值购买未来梦想,因此所有VC项目从数字角度看都存在泡沫 [32] - 适当的估值泡沫像啤酒泡沫一样,能推动行业进步,需要警惕的是二级市场因情绪反转可能出现的剧烈波动 [32] - 一级市场的泡沫由投资人消化,但过高的后期估值(如1-2亿美元甚至更高)最终会回归正常 [33] 基金管理与募资环境 - 当前募资环境发生根本性转变:从过去美元、个人LP主导,重仓消费互联网、赴美上市,转变为现在人民币、国资主导,聚焦科技赛道、赴港股/A股科创板上市 [16][90] - 面对政府引导基金的返投要求,管理公司面临生存与保持投资独立性的两难选择,策略是“先顾当下”但尽力守住LP多元化的通道 [91] - 坚决不拿返投难度极大的区域政府引导基金的钱,核心是控制将基金做大的欲望,以保持投资策略的独立性与基金收益 [94][95][97] - 基金规模与收益存在天然负相关,盲目扩大规模会导致项目质量下降,应在能力边界内稳健发展 [97][98]
英伟达的下一个Mellanox-针对Agentic-AI底时延的Groq-LPU
2026-03-02 01:22
关键要点总结 涉及的行业与公司 * 行业:人工智能芯片、高性能计算、半导体制造与先进封装 * 公司:英伟达、Groq、台积电、英特尔、AMD 核心观点与论据 英伟达的战略与并购逻辑 * 英伟达处理Groq的策略与2019年收购Mellanox的路径一致,旨在吸收其技术团队与IP并融合进后续产品,而非以独立产品线形式销售,以强化其在高性能计算领域的护城河[1][2] * 英伟达当前的三大护城河被定义为:高性价比算力、interconnect(互联技术)、CUDA软件生态[2] Groq LPU的技术定位与设计初衷 * Groq LPU主要针对推理侧对极低时延的刚性需求,尤其适配batch size=1的推理场景[1][4] * GPU擅长训练和batch size较大的推理,而面向Agentic AI/AGI应用,推理环节的多步链式处理需要更强调低时延和确定性的架构[4] * 实现超低时延的两大关键技术:1) 采用约230MB的片上SRAM以降低外部存储访问时延[5];2) 通过compiler定义确定性时序,实现更稳定可预测的低时延表现[5] LPU与英伟达产品的整合路径与时间线 * LPU与英伟达GPU的整合预计至少需要18-24个月,最可能落地在Finman那一代产品[1][6] * 整合形态更可能是封装级集成,采用chiplet思路,将LPU die与Finman compute die通过混合键合和TSV技术结合,以实现极低时延的数据交互[1][6] * Finman compute die可能采用台积电A16节点,而承载大量SRAM的LPU die可能选择更成熟的3nm或4nm节点,以利于实现更高的SRAM配置密度和3D堆叠集成[1][7] * LPU能力将整合进GPU体系内部,通过chiplet形态纳入整体架构,不会以独立LPU产品形式推出[1][7] 技术协同与产业链影响 * LPU的整合不会对HBM用量产生影响,因为HBM面向训练和大batch size推理,而LPU的SRAM属于GPU内部另一层级的memory[8] * 若方案落地,受益方向更可能集中在Triplet相关的先进封装环节,而非HBM或PCB方向[1][9] * 台积电A16节点将引入背部供电技术,可腾出正面布线空间用于放置LPU chiplet,支撑通过triplet架构进行集成,并有助于降低功耗[3][13] * LPU存在互联可扩展性局限,其架构最多可连到576颗并保持性能,英伟达可能通过将LPU直接放入GPU架构内部来规避此问题,将互联重点转回NVLink框架[3][9] * LPU的软件体系有融合进CUDA的可行路径,即可将其SRAM视为memory hierarchy中的新增一层,通过CUDA既有的内存管理方式进行统一调度[10] CPU架构演进与市场策略 * 需关注Rubin Ultra是否会提供X86架构选项,这与英伟达近期加仓英特尔、清仓ARM的持仓变化存在逻辑关联[12] * 推理与Agentic AI的强化使CPU在推理与指令处理环节的作用被重新认识,X86因指令丰富、功能覆盖强,其重要性可能上升[12] * 英特尔可能不再区分P核与E核路线,转向只做一条路线,可能与功耗优化诉求相关[13] * 英伟达CPU路线分三步:先scale out,再scale up,最终走向全光架构[14] * 2026年是CPU元年,因Rubin是第一批上CPU的产品;2027年预计将是CPU放量的一年,依据是Rubin Ultra阶段CPU将上scale up,量级将明显提升[14][15] 产品发布与行业展望 * 即将到来的GTC大会,Rubin相关内容因已多次披露,预计不会作为主要篇幅;更值得关注的是Rubin Ultra以及Firemon加LPU的架构方向等主线[11] * 对大模型驱动的AI长期演进判断:大模型不是通往AGI的唯一道路,当前处在“青黄不接”阶段,后续会出现新的算法以及改良算法[16] * 近期李飞飞与杨乐昆倡导的“世界模型”方向,强调Spatial Intelligence,试图刻画“世界中正在发生的事情”,被认为对机器人智能发展尤为关键[16] * 不同算法在不同时间点对芯片的需求结构可能不同,需求强弱可能阶段性切换[16] 其他重要内容 * 对英伟达的投资观点:财报后目标价格为310美元,认为对2026年利润等预期的定价已相对充分[16] * 整体建议持续关注GTC三大重点所映射的全链条机会[16]
2亿美金留不住的华人天才,为何集体投奔OpenAI?
新浪财经· 2026-02-27 18:11
文章核心观点 - 硅谷顶尖AI人才正从Meta向OpenAI集中流动 这并非单纯受薪酬驱动 而是由对顶级算力资源 前沿研究平台和实现技术突破可能性的追求所主导 反映了人工智能行业竞争核心要素的转变[3][5][15] - 行业竞争正从算法和算力的比拼 转向对能提升系统效率的“基建型”人才 以及能融合理论与工程解决根本性难题的顶尖学者的争夺[11][12] - 人才流动揭示了硅谷的新秩序:平台与资源(尤其是算力和世界模型基础设施)的吸引力已超越天价薪酬 成为吸引顶尖人才的首要因素[7][8][10] 关键人才流动事件 - Meta AI基础设施负责人庞若鸣在入职仅7个月后转投OpenAI 其此前薪酬包价值超过2亿美金(约合人民币14.35亿元)[3][6] - 此前一周 Meta FAIR的清华博士张鹏川也已加入OpenAI 张鹏川是Segment Anything 3的项目负责人 并主导了Llama 3和Llama 4的视觉项目[5][8] - 2026年初以来 已有包括Avi Verma Ethan Knight在内的多位身价超2亿美金的人才从Meta跳槽至OpenAI[10] 人才流动的驱动因素 - **平台与算力吸引力**:OpenAI提供的“算力+Sora级别的世界建模基础设施”被视为探索下一代AI(如物理智能 世界模拟)边界的关键 对庞若鸣等基建专家构成核心吸引力[7][8] - **对技术突破的追求**:顶尖研究员更看重“看不到成果的希望” Meta在Llama 4发布翻车后近一年内 未能推出对标GPT-4o或Sora的颠覆性产品 而OpenAI已被视为能“最快通向未来的游轮”[10][15] - **同侪与集聚效应**:OpenAI已形成强大的虹吸力 当越来越多顶尖华人研究员聚集 并由Sora负责人等亲自欢迎时 产生的“同侪吸引力”难以估量[10] 行业竞争要素的演变 - **“基建型”人才成为硬通货**:行业竞争重点从算力稀缺时代的算法 转向算力过剩时代的系统效率 像庞若鸣这样懂硬件 分布式和底层架构 能极大提升算力利用效率的人才成为战略资源[11] - **“理论+工程双驱动”成为新方向**:为突破大模型的“暴力美学”瓶颈(如幻觉 数学推理) OpenAI开始重仓AI4S 引入陈立杰等理论计算机顶尖学者 旨在从底层数学逻辑重构模型推理框架[11][12] - **人才定价逻辑改变**:市场为顶尖基础设施负责人开出2亿美金薪酬 是因他们能为公司节省数十亿美金算力成本并抢回关键发展时间[15] 涉及公司与背景 - **Meta**:尽管挥舞天价支票簿并豪掷千金组建“超级智能实验室” 但其人才持续流向OpenAI “超级智能实验室”被戏称为OpenAI的“人才后花园”[5][10] - **OpenAI**:作为有限营利公司 其在纯现金薪酬上对比Meta无绝对优势 但其在算力 世界模型基础设施(如Sora)以及前沿探索方向(世界模拟 机器人 AI4S)上构建了强大平台吸引力[7][8][11] - **关键人物背景**:流动的顶尖华人研究员多拥有顶尖中国本科教育(如清华 上海交大)和美国的博士及工业界训练(如谷歌 苹果) 是全球化教育体系的产物[6][14]
AI“世界模型”兵临城下,Unity中国要卖了?
国际金融报· 2026-02-26 21:49
Unity中国业务潜在出售评估 - 彭博社报道称Unity正在评估其中国业务的各种可能性,包括潜在出售,并可能寻求超过10亿美元的估值 [1] - 针对此报道,Unity中国回应称“内部目前无法分享过多信息” [2] Unity在中国市场的发展与本地化 - Unity于2012年进入中国,其引擎技术广泛应用于《王者荣耀》《原神》等国民级手游及新能源汽车的3D智能座舱 [2] - 2022年8月,Unity在中国成立合资企业“Unity中国”,阿里巴巴、中国移动、字节跳动、米哈游等本土巨头参与投资 [2] - 为更好适配本地需求,Unity中国推出了以本土研发为核心的“团结引擎”,深度集成微信及抖音小游戏生态,并原生支持鸿蒙OpenHarmony平台系统 [2] 团结引擎面临的挑战与竞争环境 - 团结引擎自推出以来伴随争议,被部分观点认为是Unity 6的“阉割版”,功能模块与插件数量不及国际版,并存在可能影响全球化开发效率、不兼容及版本迭代问题 [3] - 国内游戏开发生态竞争激烈,Epic Games旗下虚幻引擎凭借图形表现与源码开放策略占据3A大作开发高地,而Cocos等本土引擎依托成本和生态适配优势在小游戏领域迅速扩张 [3] Unity公司整体经营与财务表现 - 2025年全年,Unity营收为18.5亿美元,同比微增2.04%,归母净亏损由2024年的6.64亿美元收窄至4.03亿美元 [5] - 2025年第四季度,公司实现总营收5.03亿美元,高于市场预期的4.8895亿美元,调整后每股收益(EPS)为0.24美元,高于市场预期的0.21美元,归母净亏损由2024年同期的1.23亿美元收窄至8996万美元 [7] - 尽管Q4业绩超预期,但公司发布的2026年Q1业绩指引为4.8亿至4.9亿美元,低于分析师普遍预期的4.918亿美元,导致财报发布当日股价重挫逾25% [8] Unity股价波动与市场环境因素 - 截至2025年12月31日,Unity股价报收44.17美元/股,而到2025年2月23日,其盘中最低已跌至16.78美元 [9] - 股价下跌部分归因于市场对AI重塑软件格局的担忧,特别是谷歌DeepMind推出的Project Genie(精灵计划)这类世界模型,被认为可能颠覆传统3D引擎和游戏开发模式,引发游戏产业及Unity股价震荡 [11] - 在潜在出售中国业务的消息传出后,Unity股价于2月25日收涨1.59%,报18.58美元/股 [12] Unity公司近年面临的内部挑战 - 2023年,Unity推出“按游戏下载量向开发者收费”的政策,遭到行业广泛反对,随后公司被迫修改政策,原CEO辞职,高管团队经历“大换血”,引发了严重的行业信任危机 [4] - 一系列事件传导至公司层面,导致财报表现承压、股价震荡,并伴随多轮内部裁员和业务重组 [4]
未知机构:人形机器人市场新信息汇总260224注以下信息为市场传-20260225
未知机构· 2026-02-25 11:40
纪要涉及的行业或公司 * **行业**:人形机器人行业[1] * **涉及公司**: * **上市公司/标的**:维宏股份(子公司汉姆电子)[1]、凯众股份[1][2]、科达利[2]、万向钱潮[2]、天准科技[3]、北特科技[4]、震裕科技[4]、模塑科技[4]、浙江荣泰[4]、恒辉安防[4] * **行业公司**:特斯拉[4]、宇树[5]、荣耀[4]、智元[2][3]、傅里叶[3]、银河通用[3]、小鹏[2]、Figure[4]、波士顿动力[4]、英伟达[3][4]、AMD[4]、Autodesk[4]、李飞飞World Labs[4]、宸境科技[5] 核心观点与论据 * **市场关注多家上市公司在人形机器人产业链的布局与进展** * 维宏股份子公司汉姆电子是宇树零巧手电机供应商,提供高价值产品(高ASP)[1] 其董事长在北美,节后特斯拉进展及与国产头部零巧手客户合作是潜在催化剂[1][2] * 凯众股份从新能源车TPU结构件切入机器人缓震结构件、足部总成、手套,已为小鹏、智元、YS累计提供近万套产品[2] 其主业含并购利润2亿元,被认为是特斯拉产业链中市值最小、弹性最大的标的之一[2] * 科达利被认为是谐波环节的强势进攻方,有望成为贝塔时代和V4时代的核心供应商[2] * 万向钱潮是特斯拉机器人轴承/新型万向节核心供应商,量产单机价值(ASP)达1万元,并新增轻量化骨架使ASP提升15%[2] 其机器人轴承已覆盖国内主要本体企业[3] * 天准科技是国内唯一英伟达合作伙伴,搭载英伟达Jetson Thor平台,已是智元、傅里叶、银河通用等公司的核心供应商[3] * 北特科技在手部和身体丝杠定点方面具备低预期、强现实及高确定性[4] * 震裕科技在泰国产能落地,供应特斯拉机器人丝杠和执行器电机铁芯,量产单机ASP为9000元,未来预计升级为关节总成[4] 其覆盖Figure、波士顿动力及国内多家头部本体企业,预计2025年机器人业务收入近亿元[4] * 模塑科技是特斯拉机器人塑料件一级供应商(Tier1),量产单机ASP为1000-1500美金,并覆盖国内多家主要本体企业[4] * 浙江荣泰从丝杠、电机已定点到执行器快定点,ASP提升,具备高确定性[4] * 恒辉安防具备唯一的耗材逻辑,是特斯拉机器人衣服环节的主角[4] * **行业技术发展与资本动向活跃** * **特斯拉**:正用数百万小时的真实世界视频训练动作条件世界模型[4] * **资本投入**:李飞飞World Labs完成新一轮10亿美元融资,由Autodesk领投,英伟达、AMD等参投,重点投向世界模型[4] * **技术路径**:宇树创始人王兴兴在春晚后采访中强调SeedDance 2.0可生成符合物理规律的视频,对机器人训练意义重大,相比视觉语言动作模型(VLA),更看好视频生成模型(即世界模型)[5] * **技术整合**:宸境科技完成OpenClaw与宇树机器人系统整合,提升机器人自主决策能力[5] * **新玩家入局与产品迭代加速** * **新进入者**:荣耀计划在2026年巴塞罗那移动通信展推出首款聚焦消费市场的人形机器人,将成为全球第一家入局的手机公司[4] * **产品发布**:宇树发布Unitree As2“可载人”四足机器人,空载续航超4小时,负载15kg续航超13km[5] 其他重要内容 * **信息性质提示**:纪要内容多次强调信息为市场传言汇总,未经二次加工,不代表个人观点,不构成投资建议,需谨慎参考[1][6] * **部分公司主业情况**: * 万向钱潮主业含海外资产装入,净利润26亿元[3] * 震裕科技主业净利润10亿元以上[4] * 模塑科技主业净利润6亿元以上[4]
高盛评"春晚机器人":硬件显著进步,推动应用普及,未来关键是底层AI
华尔街见闻· 2026-02-23 10:54
核心观点 - 2026年央视春晚的人形机器人表演标志着行业在硬件工程和全身控制方面取得显著进步,但表演的高度编排性使其底层人工智能通用能力和在非结构化环境中的自主性仍待检验 [1] - 春晚的巨大影响力有助于提升社会对人形机器人的认知和接受度,为技术拓展到工业以外的服务业、娱乐、教育等领域铺平道路 [3] - 高盛预测全球人形机器人出货量将从2025年的1.5万至2万台,数倍增长至2026年的5.1万台和2027年的7.6万台,增长主要由特定商业应用推动 [1][4] - 行业长期的上行空间取决于人工智能通用能力的发展速度,特别是“世界模型”技术路径的进展 [1][6] 硬件与工程能力展示 - 马年春晚成为中国人形机器人技术的重要展示平台,宇树、诺特力、Magic Lab和Galbot等民营企业的表演展现了硬件和全身控制的重大进步 [1] - 宇树机器人展示了多机协调、同步动作、流畅运动、动态平衡以及类似人类的敏捷性故障恢复能力 [2] - Magic Lab和Galbot的机器人呈现了令人印象深刻的灵巧性,能够精确执行复杂操作 [2] - 诺特力机器人强调了其与人类的无缝协作和富有表现力的动作 [2] - 这些表演证明了行业在执行器技术、传感器集成和先进控制算法方面的快速改进 [2] 人工智能能力评估 - 春晚表演通常是预先编程和精心排练的,依赖预定义轨迹和反应行为,旨在展示受控条件下的最大潜力 [2] - 因此,表演虽物理执行完美,但机器人的认知智能、适应能力以及在非结构化环境中独立学习和操作的真实能力尚不明确 [2] - 高度编排的表演难以充分评估其底层人工智能能力 [1] 社会认知与应用前景 - 春晚的巨大收视率为提升社会认知和拓宽公众对人形机器人理解提供了宝贵机会,有助于揭开技术神秘面纱并可能缓解公众焦虑 [3] - 在娱乐背景下展示人形机器人,有助于培养更积极的技术认知和接受度 [3] - 公众接受度的提升对于将潜在应用拓展到传统工业环境之外至关重要,为融入服务业、娱乐、教育及个人辅助领域打开大门 [3] - 近期的增长主要由专用商业部署推动,例如公共场所的安保巡逻和客户服务(酒店、银行、博物馆等),这些应用有效利用了现有能力并规避了高度灵巧操作的复杂性 [4] 市场预测与供应链 - 高盛维持预测:2026年全球人形机器人出货量5.1万台,2027年7.6万台,较2025年的1.5-2万台实现数倍增长 [1][4] - 市场可能在未来几个交易日对主要人形机器人供应链股票做出积极反应,预期未来几年将出现应用激增 [5] - 然而,2026年一季度业绩对于重度依赖中国电动汽车市场的机器人产业链股票可能具有挑战性 [5] - 原材料成本通胀,特别是铜、银、金和存储芯片,对近期利润率趋势构成潜在风险 [6] 长期发展驱动力 - 长期来看,人工智能通用能力的发展速度将决定行业上行空间,这由有效的数据和模型策略驱动 [1][6] - 人工智能能力的发展将决定行业相对于其2035年138万台基准预期的潜在上行空间 [6] - 高盛特别关注“世界模型”技术路径,该方法涉及学习环境的内部表示或模拟,使人工智能代理能够理解世界运作、预测未来状态并规划行动,无需持续物理交互 [6] - “世界模型”使机器人能够推理因果关系,为潜在更通用、更有能力和更安全的机器铺平道路 [6]