Workflow
世界模型竞赛
icon
搜索文档
马斯克旗下xAI加入“世界模型”竞赛,“视觉模型”会是下一个“大语言模型”吗?
硬AI· 2025-10-13 22:23
行业趋势:AI竞赛新焦点 - 人工智能领域的竞争正从大语言模型扩展至能够理解并模拟真实物理世界的"世界模型" [2][3] - 谷歌研究人员推断未来的视频模型将变得和语言模型一样智能 [2][4] - 英伟达表示世界模型的潜在市场规模可能接近当前全球经济的总量 [4] xAI的战略布局 - xAI从英伟达聘请了人工智能专家Zeeshan Patel和Ethan He,专门从事世界模型研发 [3][6] - 公司计划将世界模型技术首先应用于游戏领域,用于生成可交互的3D环境 [6] - xAI正在探索世界模型在机器人系统中的应用 [2] - 公司为"omni团队"招聘图像和视频生成技术人员,薪资范围高达18万至44万美元 [8] - 公司以时薪45至100美元招聘"视频游戏导师"以训练其AI模型Grok制作视频游戏 [9] 技术范式转移 - 谷歌视频模型Veo 3展现出与大语言模型相似的"涌现能力",通过"下一帧预测"零样本解锁物体分割、边缘检测等能力 [11] - 机器视觉领域可能通过视频模型发生向通用模型的转变,迎来"视觉领域的GPT-3时刻" [14] - 视频逐帧生成的过程被称为"帧链",使视频模型能够跨越时空进行推理 [14] - 发展更智能的视频模型可能获得能力极强的机器人"代理" [15] 面临的挑战 - 世界模型技术面临的主要挑战是为模拟真实世界寻找和处理足够训练数据的成本极其高昂 [17] - 业界存在对AI作用的冷静审视,认为AI无法解决游戏行业的"领导力和愿景"等大问题 [17] - 纯粹的技术突破本身并不能保证创造出能够真正打动人心的商业产品 [17]