Workflow
Physical AI
icon
搜索文档
从预测到干预,Aether AI为什么押注因果世界模型?
机器之心· 2026-06-24 11:04
文章核心观点 - 当前基于大规模数据训练的AI模型擅长从历史数据中学习统计规律并进行预测,但在进入动态、开放的物理世界时面临根本性挑战,即模型缺乏对世界底层因果机制的理解,导致其在面对新环境、新任务时泛化能力弱、难以解释失败原因且无法有效干预世界[2][8][41] - Aether AI公司提出“因果世界模型”技术路线,旨在让AI系统从被动预测转向主动干预,通过识别真正影响结果的因果变量、理解变量间的因果结构并模拟不同干预的后果,以解决物理AI在泛化、长尾、失败归因和跨平台迁移等方面的核心难题[3][5][42] - 创始人黄碧薇教授基于其在因果AI领域十余年的学术积累,认为当前是大模型提供强大感知与表征能力、物理AI需求显性化的关键窗口期,决定将因果AI理论工程化,以Physical AI作为最硬核的落地场景进行验证和产品化[39][41][42] AI在物理世界面临的挑战与范式转变 1. **预测与因果的鸿沟**:当前AI(如大语言模型、视频生成模型、具身模型)的核心能力是从海量数据中学习统计规律以“预测下一步”,但这无法回答“为什么会发生”这一因果问题[7][8] 2. **物理世界的结构性差距**:在数字世界,预测错误可以低成本重试;但在物理世界(如自动驾驶、机器人操作),面对训练数据中极少出现的状况,仅依赖历史相关性的AI系统会变得脆弱[8] 3. **仅靠预测的AI的四类问题**:无法识别决定结果的真正变量;无法应对从未出现过的干预;任务失败时难以追溯根因;环境改变时相关关系易失效而缺乏稳定机制支持泛化[17] Aether AI的因果世界模型技术路线 1. **核心定义与目标**:将技术路线定义为“因果世界模型”,核心是让模型识别真正影响结果的变量、理解变量间的因果结构,并在采取行动前模拟不同干预可能带来的后果,从而让AI从相关性预测走向机制建模,从被动观察走向主动干预[3][5] 2. **三类核心能力**: - **因果特征表示学习**:解决“世界该如何表示”的问题,目标是在隐空间中分离出真正影响任务结果的变量,压缩掉任务无关的视觉细节噪声,形成紧凑、任务充分的动态表示[12][14] - **因果结构发现**:解决“哪些变量真正决定了结果”的问题,基于结构因果模型理论,从变量中识别真正的因果链条,区分背景噪声与真正改变结果的变量,寻找环境变化后仍稳定的机制[12][18] - **因果动力学建模**:解决“行动之后世界如何变化”的问题,关键区别在于不仅要预测下一状态,还要模拟不同干预会带来的不同后果,特别关注接触、抓取等导致动力学模式切换的关键阶段[12][19] 3. **代表性研究进展**: - **任务中心世界模型 (TC-WM)**:学习“足够表达任务、又不过度携带冗余信息”的任务中心动态表示,而非直接使用视觉基础模型的高维embedding[14][16] - **交互式物体操作**:通过Interaction-weighted Resampling方法,围绕接触前、中、后的关键阶段重采样,让模型更关注动力学模式变化的位置,在交互密集型仿真任务中取得平均19.8%的性能提升,部分任务提升超50%;真实机器人空气曲棍球实验成功率从25%提升至60%[19][20][21] - **生成式决策 (Ada-Diffuser)**:决策模型不仅要知道“什么轨迹看起来合理”,还要建模“哪些隐藏条件让这条轨迹成立”[23][25] - **跨本体动作表示 (SCAR)**:将动作视为独立表征因素,学习动作造成的“可控变化”本身,以实现跨不同机器人平台的迁移和泛化[25][27] Aether AI的四层因果AI架构 1. **Causation Transformer(最底层)**:在传统Transformer学习统计依赖的基础上,进一步识别因果影响,判断“如果改变这里,结果是否会随之改变”[28] 2. **模块化神经架构(第二层)**:按因果机制(如接触、支撑、重力、摩擦、动作影响)而非工程流程进行模块拆分,形成可复用、可组合、可迁移的模块,以支持环境变化时的机制复用[28] 3. **因果世界模型(第三层,核心)**:不仅学习状态转移预测,更追问动作改变了哪些因果变量、这些变量如何传导到结果、以及换一种干预会发生什么,使模型能在行动前模拟世界如何被改变[28][29] 4. **因果驱动智能体系统(最顶层)**:将因果世界模型用于规划、归因、记忆和恢复,使智能体能判断失败是源于感知误差、动作偏差、环境变化还是上游规划错误,并能在状态、动作或任务空间本身发生变化时,用少量新数据完成适配[28][30] 创业背景与市场窗口 1. **学术积累与工程化动机**:创始人黄碧薇教授在因果发现、因果表示学习等领域有十余年研究积累,参与推动多个因果AI工具与社区建设;她认识到验证因果世界模型在物理世界中的有效性需要远超实验室规模的工程投入,因此决定创业[36][39] 2. **市场时机成熟**: - **能力基础**:大模型证明了规模化学习的力量,为AI系统提供了更强的感知、表征和生成能力,但同时也暴露出“有规模无结构”的瓶颈,即缺乏因果层导致在物理世界中泛化能力弱、脆弱性高[41][42] - **需求显性化**:Physical AI(机器人、自动驾驶、工业自动化)正从概念走向落地,系统进入更复杂开放的环境,泛化、长尾、失败归因和跨平台迁移等从实验室问题变为真实部署中的工程痛点,对因果这类底层能力的需求变得显性[41][42] 3. **行业现状与切入点**:因果AI学术圈内创业稀少,方法论派系各自深耕但缺乏融合与工程化检验;公司选择从Physical AI切入,因为物理世界中机器人的每一次动作都是一次干预,失误会立刻暴露,是检验因果推理最硬核的课题[40][42][43]
Z Potentials|专访Aether AI黄碧薇:第三代因果AI领头人,一位不追热点的女科学家重新定义世界模型
Z Potentials· 2026-06-24 11:04
文|武静静 推荐语 当大模型、视频生成与具身智能掀起一轮轮浪潮时, Aether AI 创始人黄碧薇 却 选择了一条 " 慢 " 路 :让 AI 真正理解世界背后的因果规律。 值得一提的 是, 这条路,她 已经 走了十余年。 作为美国加州大学圣地亚哥分校( UCSD )助理教授, 黄碧薇的学术轨迹几乎与因果 AI 的当代演进同频。她亲历并推动 了这个 领域多个关键方向的突 破。但与许多研究者不断向外开疆拓土不同,她的路径始终向内、向下 —— 追问本源。 起点,源于本科时一门神经网络课程 ,激发了她对 " 大脑如何启发 AI" 的兴趣;随后 , 她进入中科院神经所 , 投身 计算神经科学,试图用机器学习理解 大脑。但她逐渐发现, 现有工具无法解释神经元之间纷繁复杂的交互,相关性统计在真正的生物系统面前显得苍白。 转折发生在德国马普所。 当她第一次接触到因果理论,并 被辛普森悖论震撼后, 一个念头清晰浮现 : 仅仅依靠相关性,永远无法触及系统运行的本质。 于是,她转身前往卡内基梅隆大学( CMU ),深耕因果发现与 Causal AI , 追寻更底层的世界规律。 当大模型时代 呼啸 到来, 学术界与工业界几乎一边 ...
KR Shipbuilding; CPSP Countdown, JPM Energy Conf on AI Power, AI in Motion; Physical AI & Robotic, HMC Labor Strike?/Toyota Production Cut: APAC Industrial & Auto Sector Specialist Sales Commentary Auto & EV - Equipment - Machinery - F&IC - AGD-20260624
摩根大通· 2026-06-24 09:08
市场表现 - 美国股市表现不一,标准普尔500指数下跌1.4%,因科技股抛售情绪加剧[1] - 美元指数连续第四天上涨,达到自5月25日以来的最高点[1] - 韩国船舶制造商Hanwha Ocean和HHI的股价在五天内下跌18%-19%[4] 行业动态 - 预计到2030年,约40%的AI数据中心电力将来自BTM(背靠背发电)[6] - 数据中心的增长推动了电力、冷却和工业供应链的需求,行业面临低估需求的风险[6] - 机器人和工业AI正从实验阶段向规模化部署转变,预计将迎来“爆发”阶段[6] 企业战略 - 丰田计划在2027年之前在日本以外地区再削减约10万辆汽车的生产,主要因中国市场需求疲软[8] - Tata Motors 在2026投资者日的要点强调了其乘用车部门的战略方向和未来展望[12] - Reliance Worldwide Corporation (RWC AU) 的不锈钢战略加速,表明公司在材料选择上的转变[12] 市场前景 - 韩国船舶制造商的基本面反馈积极,投资者关注其在全球海军扩张和AI数据中心的增长潜力[6] - Korea Shipbuilding 的市场情绪有所改善,风险与回报的比率正在改善[12] - 全球汽车市场的动态和研究显示出行业的持续变化和发展趋势[12] 会议与报告 - J.P. Morgan的多场会议和论坛为投资者提供了深入的行业见解和交流机会[12] - 报告强调了J.P. Morgan在金融服务领域的综合能力和市场影响力[30] - 提到所有通过服务提供的数据和信息均由J.P. Morgan提供,确保信息的准确性和可靠性[31]
Hexagon (HEXAb.ST): Recovery in core business and long-term opportunity in robotics already in premium valuation; Maintain Neutral-20260623
花旗· 2026-06-23 23:12
业绩总结 - Hexagon近期进行了业务剥离和分拆,更新后的财务模型显示2026-2028年收入和盈利预测分别下调28-29%和31-36%[1] - 2026年总收入预期为39.63亿欧元,较之前预期的55.22亿欧元下降28%[6] - 2026年调整后每股收益(EPS)预期为0.30欧元,较之前的0.44欧元下降31%[6] - 2026年调整后EBIT预期为10.49亿欧元,较之前的15.68亿欧元下降33%[6] - 2026年有机增长预期为6.1%,略低于市场共识的6.9%[9] - 预计2026年运营利润将低于市场共识,主要由于外汇波动和机器人投资的增加[1] 估值与市场表现 - Hexagon的估值约为2027年预期EV/EBITAC的21倍,且自由现金流收益率约为3%[2] - Hexagon目前的市场估值比欧洲工业同行高出约20%[2] - 目标价下调至82克朗,较之前的86.82克朗下降[4] - 预计2026年总回报率为1.2%,包括1.2%的股息收益率[4] - 基于折现现金流(DCF)模型的目标价格为82瑞典克朗,假设10年收入年复合增长率约为4-5%[21] 风险因素 - 上行风险包括关键市场的周期性复苏超出预期、增值并购以及机器人业务的商业化迹象[22] - 下行风险包括宏观驱动的需求疲软持续、研发强度高导致的利润改善挑战以及机器人投资的商业化缺乏可见性[22] - 目标价格可能受到上述因素的影响,导致股价未能达到或超过目标价[23] 投资建议 - Citi Research的研究推荐在2026年第一季度的分布为:买入33%(63%曾接受投资服务),持有44%(52%),卖出23%(46%),相对价值0.5%(89%)[48] - 当前Hexagon股票评级为中性,风险回报特征相对平衡,反映出增长和利润恢复的预期[20]
英伟达、亚马逊、高通集体下注,14亿美元买的到底是什么?
机器人大讲堂· 2026-06-23 21:09
文章核心观点 - 海外机器人赛道出现一笔具有信号意义的大额融资,德国认知机器人公司NEURA Robotics完成最高14亿美元C轮融资,吸引了包括英伟达、亚马逊、高通、博世、舍弗勒、欧洲投资银行等横跨AI算力、云、芯片、工业制造与汽车供应链的巨头参与 [1] - 融资信号表明,机器人行业的竞争焦点正在从追求“形似人”的演示能力,转向构建能在真实世界中持续学习、稳定部署并沉淀可复用能力的“Physical AI”基础设施 [3][20][24] - 巨头们集体下注的并非单一机器人产品,而是围绕机器人从演示走向真实世界所必须补上的平台、训练场、数据闭环和规模化交付体系 [3][4][21] 根据相关目录分别进行总结 01. 巨头集体入场,14亿美元买的不是一台机器人 - 投资方阵容横跨产业链关键环节:英伟达代表AI算力与仿真训练生态,亚马逊代表云基础设施与真实应用场景,高通代表边缘计算与终端芯片,博世与舍弗勒代表德国工业制造与供应链体系 [4] - 这轮融资是跨产业链巨头对机器人未来入口的提前卡位,投入的是一组围绕机器人落地所需能力展开的产业资源,而非单一资本 [4] - 资本关注重点从机器人本体形态转向其能否长期稳定运行、适应不确定性、持续学习以及被批量制造、部署和维护的系统能力 [4][5] 02. NEURA Robotics是谁? - 公司是一家成立于德国的“认知机器人”公司,强调机器人对外部环境的感知、理解、交互和学习能力,而非仅执行固定动作 [6] - 产品布局不局限于人形机器人4NE1,还覆盖协作机器人、移动机器人、服务机器人等多个方向,旨在构建完整的认知机器人矩阵 [8] - 公司的核心是试图将机器人本体、AI模型、传感器、边缘计算、真实训练数据、制造和部署网络整合成一套面向物理世界的AI基础设施 [5][8] 03. Physical AI:AI不只要会说,还要会做 - Physical AI指AI从数字世界(处理文本、图像)走向物理世界,能够感知、移动、抓取、协作并完成真实任务 [10][23] - 在物理世界中,AI需处理重量、材质、摩擦力、环境变化等不确定性,并将指令转化为稳定、安全、可执行的动作,这比数字AI更复杂 [11][13] - NEURA Robotics押注的正是这条从数字智能走向物理智能的路径,解决机器人“看懂”环境并可靠行动的问题 [14] 04. Neuraverse:机器人也开始拥有网络效应 - Neuraverse旨在解决机器人经验难以跨场景、跨设备迁移的问题,通过连接分散在不同机器人、场景和任务中的经验,形成可复用和放大的系统能力 [16][18][19] - 该平台试图将单次任务背后的数据、策略、失败修正和环境反馈沉淀为行业可直接调用的能力,以加速机器人规模化部署 [18][19] - 当机器人从单机智能走向群体进化,资本看重的是公司能否掌握持续学习、部署和扩张的底层入口 [19] 05. 从像人到懂世界,机器人竞争正在换题 - 行业竞争焦点从“谁更像人”(形态、运动演示)转向“谁更懂真实世界”(理解环境、适应变化、持续学习、稳定交付) [20][24] - 真实场景(工厂、仓库、医院、家庭)的复杂性、不确定性和高安全要求,使得机器人完成单次演示不等于能长期稳定工作或快速复制 [20] - 未来机器人企业的关键能力在于能否将一次次真实任务的经验转化为下一次更可靠的行动能力 [23]
Striding AI Announces Development of Next-Generation Robotic Foundation Systems for Physical AI Deployment
Globenewswire· 2026-06-23 18:49
公司战略与愿景 - 公司正在开发新一代机器人基础系统,旨在加速物理人工智能在现实世界环境中的部署[1] - 公司采用系统优先的方法构建物理人工智能,整合基础模型、机器人软硬件、数据基础设施、控制系统和部署工程,以构建可扩展的服务[7] - 公司的长期愿景是打造能够从现实世界经验中学习、持续改进并融入日常人类环境的机器人[9][10] 核心技术路径 - 公司专注于构建机器人感知、推理、行动并通过与物理世界交互持续改进所需的基础技术[3] - 核心技术路径包括整合先进的基础模型与机器人感知、控制系统、现实世界行动数据及部署基础设施[3] - 公司通过世界行动模型和下一代强化学习技术推动物理人工智能的边界[5] - 公司正在开发的新一代机器人基础系统能够将多模态感知转化为现实世界的机器人行动[11] - 系统通过整合基础模型与机器人感知、控制和现实世界行动数据,学习行动如何影响和改变物理世界的可操作表征,使机器人能更有效地跨任务和环境迁移技能[11] - 这些能力被集成到一个涵盖感知、规划、执行、反馈和恢复的闭环机器人架构中,其中人在环强化学习将现实世界操作转化为持续的训练数据[12] 市场应用与部署 - 公司计划从零售等结构化环境中的实际部署场景开始,机器人可支持的任务包括货架补货、库存盘点、商品整理和结账协助[8] - 这些环境提供了频繁的人机交互、可重复的工作流程和丰富的运营数据,是开发可扩展物理人工智能系统的理想起点[8] - 公司预计其机器人基础系统将支持更广泛行业的应用,包括零售、食品、农业、物流、医疗保健和电信[9] 团队与能力 - 公司由世界级的研究人员、工程师、产品构建者和商业领袖驱动[5] - 领导团队包括在人工智能芯片、自动驾驶、机器人研究和工业技术领域有背景的创始人和高管,兼具深厚技术专长和将复杂技术引入生产环境的经验[7] - 公司旨在通过加速机器人在商业和工业应用中的大规模采用,成为领先的可信赖机器人服务提供商[5] 研发进展与基础设施 - 在早期内部测试中,公司的人在环强化学习方法将任务成功率提高了高达3倍[13] - 为扩大此飞轮效应,公司正在构建用于机器人预训练、分布式强化学习以及边云协同的基础设施,打造一个随着更多机器人在现实环境中运行而不断改进的平台[13] - 公司认为物理人工智能是一项全栈工作,基础模型、机器人系统、数据、基础设施和部署能力必须共同进步[14]