一张图生成游戏?谷歌Genie体验:万物皆可玩,但离“杀死游戏公司”还远
36氪·2026-02-07 18:08

谷歌Project Genie发布及其核心能力 - 谷歌宣布向部分用户开放体验Project Genie原型版本 该AI工具能根据用户提供的照片、草图或文字描述生成可交互的虚拟世界 实现“生成即交互” [1][8] - 用户可指定游戏内角色的操作方式 如走路、骑行、飞行或开车 Project Genie会尝试理解物理规律并生成一个可供操控的世界 [11][13] - 生成的世界并非一次性产品 用户可在已有世界基础上通过修改提示词进行编辑 例如更换角色或物体 并能将生成内容导出为视频进行分享 [14][16] 市场对Project Genie的初步反应 - 消息公布后 相关游戏公司股价出现显著下跌 其中《GTA》开发商R星的母公司Take-Two Interactive股价下跌10% 在线游戏平台Roblox下跌超过12% 游戏引擎制造商Unity下跌21% [4] - 相比之下 国内厂商如网易和腾讯的股价基本未受影响 [4] Project Genie的技术原理与当前局限性 - Project Genie的核心模型Genie 3是一个采用自回归生成机制的帧生成模型 它通过分析前几帧画面来预测并生成下一帧 而非播放预渲染内容 [24] - 该模型通过学习了超过20万小时的游戏视频数据来建立操作与画面变化的关联 [26] - 当前体验存在明显缺陷 包括缺乏一致性 例如角色面部特征在短时间内发生不可控的剧烈变化 以及缺乏可靠逻辑 导致角色穿墙、陷入地板或场景出现无逻辑形变等 [27][29][31] - 谷歌为防止AI算力过载或逻辑崩坏 将玩家可生成的片段长度限制在一分钟 但即便在此限制下 记忆丢失和逻辑错误问题依然突出 [27][31] Project Genie的行业定位与潜在影响 - 该技术目前的主要价值在于为游戏设计师提供快速验证灵感的工具 对普通玩家而言 更多是一个可短暂娱乐的新鲜玩具 距离真正的沉浸式可玩性游戏尚有距离 [32] - 其意义超越了游戏创作本身 代表了人工智能从“理解静态世界”向“模拟真实世界”迈出的关键一步 是实现从被动展示到主动交互、从静态叙事到动态推演的重要进展 [33][35] - 世界模型被视为通往通用人工智能(AGI)的必经之路 其成熟形态可用于在虚拟世界中训练AI机器人完成各类任务 再将算法迁移至实体机器人 从而降低现实训练成本 [35] 行业竞争格局 - 多家科技巨头正在布局世界模型赛道 OpenAI明确其视频生成模型Sora本质上是世界模型 英伟达新推出的Cosmos模型则专注于让AI理解物理定律 [35] - 相比之下 国内游戏大厂如网易和腾讯的AI应用方向被描述为“用AI赋能游戏” 例如开发AI NPC或游戏AI对手 被认为尚未触及颠覆游戏创作流程的层面 [23]