Workflow
AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
机器之心·2025-06-13 10:32

通用人工智能与世界模型 - 谷歌DeepMind研究证明,能够处理复杂长期任务的AI智能体必须学习内部世界模型,且该模型可从智能体行为中提取[3][4][5] - 世界模型是实现多步骤目标导向行为的必要要素,提升智能体性能需学习更精确的世界模型[5][20][34] - 实验显示智能体处理目标深度(n)增加时,提取的世界模型误差按O(δ/√n)+O(1/n)比例下降[32][33][34] 理论框架构建 - 研究基于四要素构建数学框架:环境(20状态5动作cMP)、目标(LTL逻辑表达)、智能体(有界目标条件策略)、世界模型(预测环境转移函数)[24][25][27][28] - 有界智能体定义为在最大目标深度n下失败率δ≤1的策略,其最优策略可最大化目标实现概率[28][29] - 世界模型精度与智能体能力正相关,当δ→0且n≫1时模型误差趋近于0[31][33][34] 算法与实验验证 - 开发Algorithm 1算法通过查询智能体复合目标行为来估计状态转移概率Pss'(a),精度参数n与目标深度2n+1相关[37][38] - 在20状态5动作稀疏转移环境中测试,即使δ=1的最坏情况下仍能恢复准确世界模型,平均误差随目标深度增加而降低[40][46] - 算法填补了"策略+目标→世界模型"的三角关系,区别于传统规划(模型+目标→策略)和IRL(模型+策略→目标)[41][43] 行业技术关联 - 研究支持Ilya Sutskever观点:大语言模型本质是学习世界模型压缩表征,预测准确度反映模型保真度[16][17][19] - Genie 2基础世界模型可通过单图像生成无限3D环境,为智能体提供经验流训练,标志从人类数据时代向经验时代转变[50][51][52] - 领域泛化需比任务泛化更深层因果理解,适应分布变化的智能体必须学习因果世界模型[45][47]