谷歌旗下最强图像模型来了，P图师要消失了？

产品发布与市场表现 - 谷歌发布最新图像生成和编辑模型Gemini 2 5 Flash Image 并登顶多个主流图像排行榜 [1] - 模型在大模型竞技场LMArena的文生图与图像编辑两个场景均排名全球第一其中图像编辑榜单得分1362分领先第二名171分 [5] - 在文生图榜单中模型以1147分排名第一超过第二名Imagen-4 0-ultra-generate的1135分 [6] - 模型在图像编辑榜单排名第一超过OpenAI的GPT-4o和阿里巴巴的Qwen-Image-Edit 在文生图榜单排名第三略逊于字节Seedream 3 0和GPT-4o [6] 技术能力与性能特点 - 模型在角色一致性提示词跟随物理逻辑真实性和画面审美方面表现优秀 [4] - 核心亮点是图像编辑能力支持多图像混合自然语言针对性修改并利用Gemini世界知识生成和编辑图像 [13] - 在渲染文本方面表现出色能生成包含清晰易读且位置合理文本的图片适合徽标图表和海报制作 [18] - 模型支持用自然语言进行针对性变换和精准局部编辑如模糊背景去除污渍移除人物改变姿势添加颜色等 [32] - 在物理知识方面表现较为出色能够预判气球爆炸后的物理特征 [35] 商业化应用与成本优势 - 单张图像生成成本不到3毛钱定价为30美元/100万个输出token 每张图像1290个输出token 价格约0 039美元远低于OpenAI的0 19美元/张 [4][17] - 模型已具备替代部分人工修图的能力可帮助设计师一键完成图像修改与创意生成适用于电商产品图制作 [4] - 在电商场景中海外用户尝试用模型生成商品展示图如将涂抹区域替换为香奈儿手袋效果逼真几乎看不出合成痕迹 [34][37] - 模型能适应产品模型和商业摄影为电子商务广告或品牌宣传制作清晰专业的商品照片 [18] 局限性 - 对中国用户的一大限制在于不支持中文输入即使用英文提示若生成内容涉及中文效果会显著下降 [4] - 在涉及中文场景的画面时会出现错误如无法正确生成中文字体 [28] - 在复杂构图指令方面仍存在缺陷如偶尔会出现多肢体等结构错误 [4][32]