文章核心观点 - OpenAI新一代多模态图像生成模型GPT-Image-2疑似泄露,其多项性能指标表现卓越,尤其在文字渲染和世界知识理解方面被认为超越了主要竞争对手谷歌的Nano Banana Pro,引发了行业和社区的广泛关注与积极评价 [1][2][4][6][12][24][25] 模型发布与测试动态 - 距离上一代GPT-Image-1.5发布已近4个月,GPT-Image-2的泄露消息在海外社区引发热议 [1][2] - 公司曾在Chatbot Arena以多个代号(如“maskingtape-alpha”、“gaffertape-alpha”和“packingtape-alpha”)对新模型进行测试,但相关测试目前已下线 [3][6] - 该模型已开始向部分ChatGPT用户逐步开放测试 [24] 模型性能表现 - 文字渲染能力:模型在文字渲染能力上表现“强得惊人” [4] - 世界知识理解:模型在世界知识理解方面表现突出,整体水平被认为可能超过谷歌的Nano Banana Pro [6] - 复杂场景生成与理解:模型能够对信息密度极高的整张网页进行约90%的还原与理解,被认为是一次“范式转变” [14] - 图像编辑保真度:相比前代V1.5,模型在图像编辑过程中出现偏离原图的问题得到显著改善,编辑后图像与原图几乎无“可察觉的差异” [19] - 图像超分辨率与修复:模型可将低分辨率图片提升为高清效果,并能去除背景纹理、滤镜及水印等干扰元素,处理后图像质量“明显优于原图” [32] - 真实感与细节:模型在生成精细的人体解剖学前视图等复杂图像时表现出色 [8],其生成的YouTube风格图片“几乎和真实效果无法区分” [12] - 特定问题改进:新一代模型有望解决前代存在的“黄色滤镜”问题 [17] 与竞争对手的比较 - 模型在多个方面被评价为对谷歌的Nano Banana Pro实现了“彻底碾压”和“超越” [25] - 模型的出现意味着DeepMind“终于迎来了真正意义上的竞争对手” [30] - 行业期待其与谷歌下一代产品Nano Banana Pro 2的正面对比表现 [30] 社区反响与行业影响 - 社区对模型表现“非常认可”,认为其“简直要碾压一切”,标志着过去被嘲笑的时代已经过去 [12][24] - 模型在生成特定人物(如奥特曼)图像的真实感上成为区分新旧版本的特征之一 [21] - 模型能生成具有话题性的内容,如奥特曼与马斯克的“和解”图像 [27] - 行业对模型正式版的登场充满期待 [34]
一夜变天:GPT-Image-2流出,昔日王者Nano Banana Pro要被拉下神坛?
机器之心·2026-04-05 11:03