Workflow
世界模型
icon
搜索文档
Meta最新论文解读:别卷刷榜了,AI Agent的下一个战场是“中训练”
36氪· 2025-10-13 15:19
AI行业竞争焦点转变 - 2025年AI竞争焦点从跑分比拼转向Agent自主完成复杂长程任务的能力 [1] - 行业巨头如xAI和Anthropic发布新品时均强调同一能力 [1] - AI的下一战场被明确为通用Agent [2] Agent落地的现实瓶颈 - 除编程领域外,Agent落地应用寥寥无几 [2] - 核心瓶颈之一是反馈机制的困境 [2] - 现有反馈机制要么太弱要么太贵,阻碍预训练模型蜕变为强大Agent [2] 主流Agent训练方法的局限性 - 模仿学习(监督微调)依赖昂贵静态反馈,高质量专家数据难以大规模生产 [4] - 模仿学习导致模型泛化能力极差,无法适应训练数据外的情况 [4] - 强化学习依赖复杂动态反馈,在真实世界任务中奖励信号常缺失、稀疏或延迟 [5] - 强化学习应用高度依赖精心设计的奖励函数或人工调整的训练流程 [5] Meta提出的“中训练”范式 - Meta等机构在2025年10月论文中提出“早期经验”的“中训练”范式 [2][7] - 该范式利用Agent自己探索产生的状态变化作为宝贵的学习信号 [7] - 设计两种具体训练策略:隐式世界建模和自我反思 [7] 隐式世界建模策略 - 让Agent学会预测“如果我这么做,世界会变成什么样” [9] - 具体步骤包括自我尝试、记录数据、微调训练预测能力 [9] - 通过大量“作死”和观察后果,让Agent悟出世界运行规律 [10] 自我反思策略 - 让Agent学会解释“为什么专家的做法比我的其他想法更好” [11] - 具体步骤包括自我尝试、教练点评、微调训练预思考能力 [11] - 训练Agent学会先生成反思推理再输出正确动作 [11] “中训练”范式的有效性验证 - 在8个多样化环境中测试显示,平均成功率比传统模仿学习提升9.6% [15] - 在未见过的任务上表现提升9.4%,显示强大泛化能力 [15] - 作为强化学习初始化时,最终性能提升最多6.4% [15] - 提升在不同复杂度的环境中保持稳定 [17] “中训练”的理论基础与价值 - 谷歌DeepMind研究证明成功Agent内部必须拥有准确“世界模型” [18] - 传统模仿学习只学习从状态到行为的浅层映射 [20] - “早期经验”补上了建立世界因果理解的关键课程 [21] - 可能需“预训练+中训练+后训练”三段式训练范式通往通用Agent [23] 参数效率与新Scaling Law可能性 - “早期经验”展示通过自我递归训练释放参数潜力的可能性 [25][27] - 700M参数小模型经训练后可在某些任务上超越参数量大十几倍的大模型 [25] - 传统增加参数量的做法边际收益递减很快 [27] - 可能预示一个新的属于Test Time Compute的Scaling Law [28]
闻泰科技半导体资产被荷兰政府冻结;Windows 10系统明日起停服;特努斯成为苹果下一任CEO热门人选
搜狐财经· 2025-10-13 13:32
闻泰科技/安世半导体资产冻结 - 荷兰政府于9月30日指令冻结闻泰科技控股子公司安世半导体的资产与知识产权调整,为期一年 [4] - 安世半导体部分外籍高管要求闻泰科技转让股权并暂停其委派的CEO职务,荷兰企业法院已暂停张学政的CEO职务和职权 [4] - 安世半导体2024年收入规模约147亿人民币,闻泰科技要求荷兰政府撤销指令并停止对中国企业的系统性歧视 [4] 微软Windows 10停服 - 微软自10月14日起停止对Windows 10系统提供安全更新和技术支持,用户设备可能更易遭受网络攻击 [6] - 微软建议用户尽快升级至Windows 11系统,因部分应用程序功能可能随停服而减弱 [6] 苹果公司动态 - 硬件工程高级副总裁约翰·特努斯(50岁)成为接替库克的CEO热门人选,其在9月开发者大会负责介绍iPhone Air [7] - 苹果自10月10日起停用Clips应用,新用户无法下载,现有用户可继续使用但应用不再更新 [8] - 分析师郭明錤称折叠iPhone铰链量产后单价预计降至70-80美元,低于市场预期的100-120美元,主因设计优化及富士康参与 [9] - 富士康与新日兴合资公司占折叠iPhone铰链约65%份额,安费诺供应剩余35%,立讯精密最快2027年后可能成为新供应商 [9] xAI与英伟达 - xAI从英伟达招募研究员Zeeshan Patel与Ethan He,开发用于电子游戏与机器人领域的“世界模型” [13] - 英伟达CEO黄仁勋10月1日至10日通过多次交易减持公司股票,累计套现超1亿美元达1.13亿美元,减持后仍持有超7060万股股票 [14] 媒体行业并购 - 华纳兄弟探索公司以报价过低为由拒绝派拉蒙天舞传媒的初步收购提议,派拉蒙报价约每股20美元 [15] - 华纳兄弟探索公司股价收于每股17.10美元,市值达423亿美元,派拉蒙股价为每股17美元,市值为186亿美元 [15] 半导体产业链 - 台积电供应商万机仪器考虑出售价值10亿美元的特种化学品部门,以聚焦于为芯片制造商供货 [16] 战略合作 - 海尔集团与阿里巴巴集团签署全面战略合作协议,将结合海尔全生态布局与阿里全栈AI能力共建数字产业新生态 [5] 全球工程成就 - 2025全球十大工程成就发布,包括Blackwell GPU架构、DeepSeek开源大语言模型及人形机器人等 [17]
马斯克xAI投身“世界模型”竞赛,欲重塑AI与现实交互新体验
搜狐财经· 2025-10-13 12:45
公司战略与研发重点 - xAI公司正全力投入“世界模型”的研发,与Meta、谷歌等科技巨头在人工智能领域展开竞争[1] - xAI今年夏天从英伟达招揽了专家团队,专注于新一代人工智能模型的打造[4] - “世界模型”以视频和机器人数据为训练素材,旨在深入理解现实世界,不同于传统基于文本训练的大型语言模型[4] - xAI为其“全能团队”招聘图像和视频生成技术人员,薪资范围从18万美元到44万美元不等[5] 技术应用与市场方向 - “世界模型”有明确的应用方向,游戏领域是重点之一,该模型可生成交互式3D环境,为玩家带来全新体验[4] - 该技术也能应用于机器人的人工智能系统,推动实体产品智能化发展[4] - xAI同时招聘电子游戏导师,负责训练Grok制作电子游戏,助力用户探索人工智能辅助的游戏设计[5] - 英伟达指出,该技术有望为人工智能在软件和计算机之外的应用开辟新途径,如人形机器人等实体产品领域[4] 技术挑战与行业动态 - “世界模型”的研发面临巨大挑战,需要实现对物理学和物体实时交互的因果性理解,目前存在数据获取困难和成本高昂等问题[4] - 目前像OpenAI的Sora等视频生成模型,通过预测训练数据模式来生成图像帧[4] - xAI聘请的研究人员在“世界模型”方面经验丰富,且英伟达的Omniverse平台在该技术领域处于领先地位,为研发提供了支持[4]
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型
创业邦· 2025-10-13 11:53
公司战略与布局 - 马斯克的xAI公司已正式入局世界模型领域,加剧了与Meta、Google DeepMind等巨头的竞争[3][9][10] - 公司计划在2026年年底前发布一款由世界模型驱动的AI生成游戏[3][29] - 公司正在组建全模态团队,专门研究图像、视频、音频的综合理解与生成,以支持世界模型开发[30] 人才招募与技术基础 - 公司于今年夏季从英伟达挖来至少两名资深研究员Zeeshan Patel和Ethan He,以增强世界模型研发实力[3][11] - 新招募的研究员此前均参与了英伟达Omniverse平台的核心开发,该平台是全球最成熟的物理一致性仿真系统之一[18][19] - 公司计划将英伟达在图形与物理模拟领域的积累应用到自家的世界模型体系中[20] 世界模型的应用前景 - 世界模型被视为AGI的核心底座,能让AI系统真正理解和推理物理3D世界,而不仅限于文本处理[23][25] - 该技术首批落地应用可能是电子游戏,旨在生成自适应、逼真的3D场景,并能根据玩家行为实时变化[29] - 世界模型技术未来可驱动智能体、自动驾驶乃至具身智能机器人,与特斯拉、Neuralink等马斯克旗下公司形成协同效应[35][36] 市场背景与行业动态 - 世界模型是近两年全球AI巨头和实验室的新战场,参与者包括Google DeepMind、Meta、英伟达和李飞飞团队等[9][28] - 视频游戏行业市场规模巨大,今年收入约2000亿美元,为AI生成游戏提供了广阔的市场空间[6]
马斯克AI公司开发“世界模型”,从英伟达挖专家将推游戏
凤凰网· 2025-10-13 11:21
公司战略与进展 - xAI公司正加紧构建能够理解现实世界动态特征的“世界模型”,旨在实现对物理环境的自主导航与设计 [1] - 公司计划将世界模型应用于游戏领域,用于生成可交互的3D环境,并计划在明年年底前推出一款由AI生成的优秀游戏 [1][2] - xAI已从英伟达聘请了两位具备世界模型研发经验的AI研究员泽尚·帕特尔与何宜晖,以加强研发能力 [2] - 公司于近期推出了最新的图像和视频生成模型,并进行了重大升级,且免费向用户开放使用 [2] 技术定义与潜力 - 世界模型是一种生成式AI模型,能利用文字、图像、视频以及动作等输入数据来生成影片,其核心是理解现实世界的物理属性和空间特性 [1] - 世界模型通过学习视频以及来自机器人的数据来理解现实世界,有望将AI能力提升到超越大语言模型的水平 [1] - 与OpenAI的Sora等逐帧生成视频的模型不同,世界模型能实时理解物理世界的因果关系,掌握物体在不同环境中的实时互动机制 [2] - 世界模型被认为能将AI应用从软件和计算机拓展到实体产品,例如人形机器人,其潜在市场规模可能接近当前全球经济总量 [2] 行业竞争格局 - 除xAI外,谷歌、Meta等领先的AI实验室也在研发世界模型系统 [3] - 英伟达凭借其能够创建并运行模拟环境的Omniverse平台,在该技术领域保持领先地位 [2] 行业面临的挑战 - 世界模型的研发面临巨大技术挑战,要找到足够的数据来模拟现实世界并训练这些模型被证明既困难又成本昂贵 [3] - 有行业观点指出,游戏行业面临的重大问题并非技术,而是领导力与远见的缺失,更需要能让玩家投入的世界呈现方式,而非算法生成的玩法循环 [3]
马斯克从英伟达挖人做AI游戏,第一步:研发世界模型
36氪· 2025-10-13 10:14
xAI入局世界模型竞争 - 马斯克的xAI公司已加入全球AI巨头在世界模型领域的竞争[1][5] - 公司于2024年夏季从英伟达招募了多名资深研究员以增强实力[1][5] 人才招募策略 - xAI至少雇佣了两位来自英伟达的研究人员:Zeeshan Patel和Ethan He[6][7] - Zeeshan Patel专注于大规模多模态模型与训练框架研发,曾在英伟达从事生成式世界模型研究[6] - Ethan He的Google Scholar被引数达8495次,研究方向包括MoE模型、多模态模型和世界模型[7][8] - 两位研究员此前均参与了英伟达Omniverse平台的核心开发工作[8] 技术基础与平台应用 - Omniverse是成熟的物理一致性仿真平台,能精确模拟现实物理规律[9] - 该平台被应用于机器人训练、3D建模、数字孪生和自动驾驶等领域[9] - xAI计划将英伟达在图形与物理模拟领域的技术积累应用于自家世界模型体系[10] 世界模型战略定位 - 世界模型被视为实现AGI(通用人工智能)的核心基础[12] - 该技术让AI系统能够真正理解和推理物理3D世界,而不仅限于文本处理[12] - 世界模型能生成可导航的3D环境,支持构建大规模虚拟世界和多元宇宙[12] 产品开发路线 - xAI入局世界模型的首批应用重点可能是电子游戏领域[14] - 团队正在开发能自动生成自适应、逼真3D场景的AI技术[14] - 目标是在2026年底前推出一款由世界模型驱动的AI生成游戏[1][14] 团队建设与资源配置 - xAI正在组建全模态团队,专门研究图像、视频、音频的综合理解与生成[15] - 公司招聘多模态技术岗位,年薪区间为18万-44万美元[15] - 特别设立"电子游戏导师"职位,时薪45-100美元,负责向模型讲解游戏机制和设计逻辑[15] 生态系统协同效应 - xAI的世界模型研发可能与马斯克旗下其他公司产生协同效应[16] - 特斯拉提供机器人和自动驾驶数据,Neuralink提供脑机接口技术[16] - 社交平台X可作为实时反馈渠道,共同构建完整的AI生态系统[16]
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型
量子位· 2025-10-13 09:35
xAI入局世界模型的战略举措 - 公司xAI正式进入世界模型领域,加入与Google DeepMind、Meta、英伟达等巨头的竞争[7][8] - 为增强实力,公司于2024年夏季从英伟达招募了多名资深研究员,包括Zeeshan Patel和Ethan He[9][18] - 新招募的研究员均曾参与英伟达Omniverse平台的核心开发,该平台是成熟的物理一致性仿真系统,与世界模型需求高度契合[21][23][24][25] 关键人才背景与专长 - Zeeshan Patel专注于大规模多模态模型与训练框架研发,拥有苹果AI/ML部门及英伟达研究院的生成式世界模型研究经验[10][11][12] - Ethan He在计算机视觉领域拥有深厚积累,Google Scholar被引数达8495,研究经历涵盖FaceBook AI的大规模视频自监督学习及英伟达的MoE模型、多模态模型[14][15][16][17] - Ethan He的代表作包括被引3483次的《Channel pruning for accelerating very deep neural networks》和被引1850次的《Amc: Automl for model compression and acceleration on mobile devices》[19] 世界模型的战略意义与应用方向 - 世界模型被视为AGI的核心底座,旨在让AI系统理解并推理物理3D世界,而不仅限于文本处理[26][27][29] - 公司xAI入局后的首批应用落点可能是电子游戏,团队正尝试开发能根据玩家行为实时变化的AI生成3D场景[33][34] - 公司目标是在2026年底前推出一款由世界模型驱动的伟大AI生成游戏[2][35] 业务布局与资源整合 - 公司内部正组建全模态团队,招聘岗位涵盖音频理解生成、多模态理解等方向,年薪区间为18万至44万美元[37] - 公司还公开招聘电子游戏导师,时薪45至100美元,旨在向模型传授游戏机制与叙事逻辑[38][39][40] - 世界模型有望将公司xAI、特斯拉的机器人及自动驾驶数据、Neuralink的脑机接口以及的平台资源整合,形成AI帝国闭环[41][43][44][45] 行业背景与市场机遇 - 世界模型已成为AI巨头和实验室的兵家必争之地,DeepMind、Meta、英伟达等均已布局相关项目[32][36] - 行业数据显示,视频游戏行业年收入约2000亿美元,远超OpenAI约100亿美元的年收入,揭示了巨大的市场潜力[4]
机器人核心技术之一,马斯克发力“世界模型”
选股宝· 2025-10-13 08:29
文章核心观点 - 马斯克的xAI公司从英伟达聘请人工智能专家,专注于研发旨在掌握真实世界物理规律的世界模型 [1] - 世界模型是理解现实世界动态的生成式AI模型,使用文本、图像、视频和运动等数据生成视频,物理AI和世界基础模型是该领域关键基础设施 [1] - 英伟达已推出相关工具产品,国内CAE厂商在物理场仿真数据和行业应用理解方面具有优势 [1] 世界模型技术 - 世界模型通过对海量视频和机器人数据进行训练,旨在掌握真实世界的物理规律,不同于依赖文本的大语言模型 [1] - 该技术在理解现实环境物理特性的前提下,对运动以及感知数据中的空间关系等动态进行表征和预测 [1] 行业应用与竞争格局 - 英伟达推出两款工具类产品,应用于智能驾驶、机器人训练以及工业数字孪生的开发 [1] - 国内CAE厂商依靠长期的物理场仿真数据积累,在物理学行业应用方面具有很大优势 [1] 相关公司动态 - 索辰科技的“天工·开物平台”基于生成式物理AI技术和实景渲染技术 [1] - 能科科技是提供工业数字孪生解决方案的厂商 [2]
全球要闻:美股指期货集体反弹贸易担忧情绪缓和 美股Q3财报季本周揭幕
搜狐财经· 2025-10-13 08:17
美股市场表现 - 上周五美股遭遇“黑色星期五”,纳斯达克指数下跌3.56%至22204.43点,标普500指数下跌2.71%至6552.51点,道琼斯指数下跌1.90%至45479.60点,纳指与标普均创半年最大跌幅 [1][2] - 周线表现来看,道琼斯指数一周跌幅为2.73%,纳斯达克指数一周跌幅为2.53%,标普500指数一周跌幅为2.43% [3] - 周一早盘美股期货反弹,标普500指数期货和道指期货均涨近1%,纳指期货涨超1% [1] 地缘政治与政策动向 - 美国副总统万斯释放缓和信号,表示特朗普愿意与中国进行理性谈判,市场将此视为TACO交易策略可能再次上演的迹象 [5] - 美国政府持续关门,原定本周公布的9月CPI数据推迟至10月24日,美股Q3财报季拉开序幕,上市公司的经济表述和裁员动作将受投资者密切审视 [6] - 美联储官员本周将频频发声,鲍威尔将于北京时间周三凌晨讲话,鲍曼和沃勒也将公开亮相 [6] 主要科技股表现 - 热门科技股普遍大幅下跌,英伟达跌4.89%,微软跌2.19%,苹果跌3.45%,亚马逊跌4.99%,Meta跌3.85%,台积电跌6.41%,特斯拉跌5.06%,超微半导体跌7.72% [9][10] - 英伟达CEO黄仁勋在10月8日至10日期间卖出22.5万股公司股票,套现逾4280万美元,10月以来累计套现超1.1亿美元 [10][16] - 马斯克的xAI公司从英伟达聘请人工智能专家,专注于世界模型的研发 [10][16] 中概股与全球市场 - 热门中概股大幅下挫,阿里巴巴跌8.45%,拼多多跌5.32%,百度跌8.09%,小鹏汽车跌8.25%,蔚来跌10.05% [11] - 欧洲股市方面,英国富时100指数跌0.86%,法国CAC40指数跌1.53%,德国DAX指数跌1.50% [10] - 亚洲股市方面,恒生指数跌1.73%,日经225指数跌1.01% [10] 大宗商品与外汇 - 国际原油价格重挫,WTI原油收跌5.43%至58.17美元/桶,创5个月新低,布伦特原油收跌4.8%至62.09美元/桶 [14] - 现货黄金价格创历史新高,一度冲上4060美元/盎司,周线录得八连阳,伦敦银现上周五收涨1.08%至49.537美元/盎司 [13][14] - 美元指数跌破99关口,收跌0.56%至98.978 [13] 其他重要公司动态 - 伯克希尔对日本五大商社的投资从约63亿美元飙升至超300亿美元,持股比例打破10%上限 [16] - 伦敦现货白银市场出现历史性逼空,流动性几乎枯竭,价格相对纽约期货出现史无前例的溢价 [17][18]
网易云音乐回应“已故歌手李玟账号被异常登录”;“鸡排哥”粉丝破百万,账号开设仅20天;商务部公告附件首次改为wps格式丨邦早报
创业邦· 2025-10-13 08:08
人工智能与芯片行业 - xAI公司重心从语言理解转向开发可用于电子游戏与机器人领域的"世界模型",并从NVIDIA招募两位研究员Zeeshan Patel与Ethan He [3] - 澳大利亚莫纳什大学开发出硬币大小、运作方式类似大脑神经通路的微型流体芯片,由金属有机框架材料制成并通过离子传输模仿神经元可塑性 [17] 半导体与科技监管 - 闻泰科技发表声明,谴责荷兰政府以国家安全为由对安世半导体实施全球运营冻结,并指责安世半导体个别外籍管理层借政治压力试图改变公司股权结构 [5] - 市场监管总局对高通公司收购Autotalks公司违法实施经营者集中事宜立案调查,指出高通在2025年6月未申报且未沟通情况下完成收购 [6][7] 汽车与出行产业 - 比亚迪中标新加坡首个L4级自动驾驶巴士官方试点项目,计划于2026年中期在特定路线测试可载16名乘客的无人驾驶巴士 [5][6] - 小鹏汇天获中东地区阿联酋、卡塔尔、科威特企业首批600台飞行汽车订单,创下该领域海外最大批量订购纪录,其"陆地航母"累计订单达7000台 [13] - 焕新极氪001正式上市,起售价26.98万元,全系升级900V高压架构支持10%至80%电量补充仅需7分钟,零百加速2秒并搭载算力700TOPS的Thor-U芯片 [15] - 上汽奥迪9月终端销量5700辆,同比增长90% [14] - 上海市调整汽车以旧换新补贴规则,10月13日至12月31日期间采用个人消费者报名、公证摇号方式获取补贴资格 [13] 资本市场与公司动态 - 英伟达CEO黄仁勋在10月8日至10日通过20笔交易卖出22.5万股股票套现4280万美元,10月以来累计套现超1.13亿美元,仍持有超过7060万股公司股票 [5] - 华纳兄弟探索公司以报价过低为由拒绝派拉蒙天舞传媒每股约20美元的初步收购提议,华纳兄弟市值达423亿美元,派拉蒙市值为186亿美元 [6] - Base Power完成10亿美元C轮融资,公司估值达30亿美元,该能源初创公司在德州部署逾100兆瓦时家用储能系统,用户安装费695至995美元并签约三年以每千瓦时8.5美分购电 [14] - 纽瑞特医疗完成8亿元D轮融资,由深创投、人保资本领投 [14] - 睿维新材料完成数千万元A轮融资,由天图资本投资,资金用于扩大生物降解材料产能与技术迭代 [14] 消费电子与游戏 - 游戏《黑神话:悟空》即将迎来更新,PS5平台补丁占用空间约93.5GB [11] - 商务部公告附件首次改为wps格式,对含有中国成分的部分境外稀土相关物项实施出口管制,申请文件须以中文提交 [7] 社会人口数据 - 韩国70岁以上人口达654.3万,首次超过20至29岁年龄段人口,20多岁人口为630.2万比上一年减少19.3万 [17]