Workflow
AGI雏形
icon
搜索文档
一下午一句话 Codex 帮我开发了一个完整的游戏!
歸藏的AI工具箱· 2026-05-01 08:33
人工智能模型能力演进 - Codex模型展现出超越传统代码助手的综合能力,能够理解目标并自主规划与执行完整任务链条,例如仅根据“做一个类似《杀戮尖塔》的游戏”的简单指令,就在一小时内生成一个名为《夜巡录:荒庙篇》、包含完整游戏循环的可玩demo[1][2][3] - 模型集成了多种内置能力,包括自带浏览器和GPT-Image 2.0图像生成模型,其结合“不达目的不罢休的执行力”,使其能力与Claude Code等工具完全不同[7][8] - 整个项目从玩法原型、代码架构、素材生成与处理、音乐生成到最终打包发布,全部在一个Codex会话中完成,展现了其处理复杂、多模态任务流程的高度集成化能力[81] 自主任务规划与资产管线构建 - 在生成游戏角色素材时,模型能自主规划完整资产管线:它在未收到任何明确指令的情况下,主动使用GPT-Image 2.0生成绿幕背景的立绘,并自行查找、安装抠图工具处理图片,最终将素材归类存放,形成从生成到可用的自动化流水线[14][17][18][21][22] - 模型展现出“目标驱动”的特性,用户仅需提出最终目标(如“调用GPT-Image 2.0生成素材”),模型便能自行补全实现路径和所需工具,改变了以往需要用户配置所有上下文和工具的模式[23][26][27] 问题解决与创造性方案 - 面对从海量素材库(一个包含几千张图的压缩包)中挑选素材的难题,模型创造性提出了第三种方案:编写脚本将上百张素材小图拼合成一张标注了文件名的大网格图(contact sheet),让多模态模型一次性视觉浏览所有素材,极大提升了检索效率[40][45][46][48][51] - 这一行为表明模型能够意识到自身工具(如视觉上下文有限)的限制,并主动为自己创造更高效的输入方式,其解决问题的思路接近资深工程师[55][56] - 在尝试下载素材遇到人机验证阻碍时,模型没有简单放弃,而是尝试分析网站结构以绕过前端限制,其“自动升级手段”以完成任务的逻辑触发了内置安全护栏[34][35][37] 多模态AI工具的协同应用 - 项目综合运用了多种生成式AI工具:使用GPT-Image 2.0生成角色立绘和怪物结算画面;使用Seedance 2.0为七个Boss生成处决动画以及标题页无缝循环背景动画;使用Suno v5.5生成符合“志怪”主题的背景音乐[60][66][68][69][74] - 在打磨游戏细节时,模型能利用这些工具提升体验:例如通过指定首尾帧相同,使Seedance 2.0生成的背景视频实现无缝循环播放;为不同攻击类型配置差异化音效和受击反馈,提升游戏“手感”[75][76][77][79] 开发流程与效率的范式转变 - 整个开发过程体现了人机协作的新模式:用户主要提供审美方向、合规把关和最终决策(如“做看门人”),而模型承担了从架构设计、代码编写、素材获取与处理到集成的绝大部分执行工作[27][82][89] - 基于此经验,开发者考虑将这套从创意到可分发demo的稳定流程封装成专门的“Skill”,未来可能实现仅输入一个玩法想法,即可在几小时内获得一个完整的游戏原型[90][91] - 这种能力使得快速原型开发成为可能,三小时即可完成包含标题、地图、战斗、事件、商店、Boss等完整循环的可玩版本,剩余时间则用于打磨音效、动画、UI反馈等提升真实感与沉浸感的细节[64][67]