GPT Image 1.5 上线:AI 图像开始走向真实生产
36氪·2025-12-18 13:46

核心观点 - OpenAI于2025年底发布新一代图像生成模型GPT Image 1.5,其核心革新并非单纯的技术能力展示,而是围绕使用方式和工作流进行的产品逻辑转向,标志着AI图像正从“能画出好看的图”走向“能真正用进工作” [1] 产品形态与设计逻辑 - GPT Image 1.5并非独立应用,而是被深度整合进ChatGPT的图像功能模块,生成、修改、确认全流程在同一对话环境中完成,减少了用户在多个工具间切换的成本 [5] - 该设计基于对真实创作场景的洞察,着重强化了“反复修改却不推翻原有框架”的稳定性,以适配图片需要反复打磨的实际工作流程 [5] - 模型在指令理解上表现更趋稳定,能更明确地响应用户的修改需求,且不易偏离原有画面逻辑,这对于需要保持品牌视觉、人物形象或教学示意一致性的场景尤为重要 [7] - 模型并未刻意强调某种“标志性风格”,而是追求一种相对中性、可控的输出,这更接近真实使用需求 [7] 性能与效率提升 - 相比早期模型,GPT Image 1.5在生成速度与编辑能力上有所提升 [1] - 生成与编辑效率的提升,使得AI图像更容易嵌入日常工作节奏,当生成和修改不再成为明显的等待节点,图像才可能成为流程中的常规环节 [7] 行业竞争格局与路线差异 - 过去一年,Google推出的图像生成模型Nano Banana在视觉冲击力和风格表现上极具辨识度,擅长制造“第一眼惊艳”,适合展示和分享 [9] - 但在需要多轮调整的任务中,Nano Banana这类强风格模型的局部编辑往往意味着重新生成,成本不低 [9] - GPT Image 1.5与Nano Banana代表了AI图像生成的两种方向:一种偏向传播和表达,一种偏向流程和交付 [12] - GPT Image 1.5并不试图在单张效果上做到最极致,而是把重点放在可编辑性和一致性上,其生成结果更容易被修改、复用和延展 [12] - 随着AI图像逐渐走向规模化应用,偏向流程和交付的路线其重要性正在被不断放大 [12] 商业应用影响 - 在商业场景中,品牌和营销团队已开始将AI图像用于初稿生成和版本扩展,设计师的工作重心从从零开始创作转向审美把关和最终确认 [15] - 这种变化意味着AI图像正从“展示能力”走向“生产资料”,开始参与到真实世界的工作流程中,承担起可被反复使用和修改的职责 [22] 教育应用影响 - 教育内容高度依赖视觉材料,其对视觉效果的要求不在于“好看”,而在于内容准确、便于理解 [18] - 可编辑性对教育场景尤为重要,教学内容常需根据学生反馈调整,图像也需随之修改 [20] - GPT Image 1.5的稳定修改能力使其在教育场景中具备适配性,教师可根据教学需要逐步调整图像内容,降低了制作门槛,缩短了内容准备周期 [20] - AI图像生产效率的提升,可能让教育工作者的更多精力回到教学设计和内容本身,AI承担的是工具角色而非决策角色 [20]

GPT Image 1.5 上线:AI 图像开始走向真实生产 - Reportify