金融时报:超级智能的下一个入口,谷歌、Meta、英伟达......科技巨头都在加码“世界模型”
行业趋势转变 - AI研发重点正从大语言模型转向"世界模型",以理解和模拟物理世界 [1][3] - 大语言模型技术进步放缓,性能飞跃开始放缓,业界认为其正触及其能力天花板 [7][8] - 这一趋势标志着AI领域竞争焦点从语言领域转向物理世界,被视为推动机器实现"超级智能"的关键一步 [3][4] 主要参与者与战略布局 - 谷歌DeepMind发布Genie 3模型,能逐帧生成视频并考虑过去的交互,通过构建模拟环境训练AI [5] - Meta开发V-JEPA模型,模仿儿童被动学习方式用原始视频内容训练,并已在机器人上进行测试 [5] - 英伟达首席执行官黄仁勋断言公司下一个主要增长阶段将来自"物理AI",正利用Omniverse平台支持向机器人领域扩张 [5] - 英伟达高管表示"世界模型"潜在市场规模可能高达100万亿美元,覆盖制造、医疗等实体领域 [1][3] 技术进展与应用前景 - "世界模型"通过学习视频和机器人数据来理解物理世界,应用前景覆盖自动驾驶、机器人和制造业等领域 [1][4] - 近期应用包括娱乐行业,初创公司World Labs开发从单张图片生成3D环境的模型,Runway推出创建游戏场景的产品 [6] - 构建"世界模型"面临巨大的数据和算力挑战,但可通过仿真环境训练,无需承担在现实世界中犯错的后果 [4][5][9] 发展挑战与时间框架 - 实现由新一代AI系统驱动、具备人类水平智能的机器可能还需要十年时间 [9] - 大语言模型被警告永远无法实现人类那样的推理和规划能力 [9] - 构建模型需要收集海量物理世界数据和算力,是一项未被攻克的重大技术挑战 [9]