Workflow
谷歌旗下最强图像模型来了,P图师要消失了?
第一财经·2025-08-27 19:20

产品发布与市场表现 - 谷歌发布最新图像生成和编辑模型Gemini 2 5 Flash Image 并登顶多个主流图像排行榜 [1] - 模型在大模型竞技场LMArena的文生图与图像编辑两个场景均排名全球第一 其中图像编辑榜单得分1362分 领先第二名171分 [5] - 在文生图榜单中模型以1147分排名第一 超过第二名Imagen-4 0-ultra-generate的1135分 [6] - 模型在图像编辑榜单排名第一 超过OpenAI的GPT-4o和阿里巴巴的Qwen-Image-Edit 在文生图榜单排名第三 略逊于字节Seedream 3 0和GPT-4o [6] 技术能力与性能特点 - 模型在角色一致性 提示词跟随 物理逻辑真实性和画面审美方面表现优秀 [4] - 核心亮点是图像编辑能力 支持多图像混合 自然语言针对性修改 并利用Gemini世界知识生成和编辑图像 [13] - 在渲染文本方面表现出色 能生成包含清晰易读且位置合理文本的图片 适合徽标 图表和海报制作 [18] - 模型支持用自然语言进行针对性变换和精准局部编辑 如模糊背景 去除污渍 移除人物 改变姿势 添加颜色等 [32] - 在物理知识方面表现较为出色 能够预判气球爆炸后的物理特征 [35] 商业化应用与成本优势 - 单张图像生成成本不到3毛钱 定价为30美元/100万个输出token 每张图像1290个输出token 价格约0 039美元 远低于OpenAI的0 19美元/张 [4][17] - 模型已具备替代部分人工修图的能力 可帮助设计师一键完成图像修改与创意生成 适用于电商产品图制作 [4] - 在电商场景中 海外用户尝试用模型生成商品展示图 如将涂抹区域替换为香奈儿手袋 效果逼真几乎看不出合成痕迹 [34][37] - 模型能适应产品模型和商业摄影 为电子商务 广告或品牌宣传制作清晰专业的商品照片 [18] 局限性 - 对中国用户的一大限制在于不支持中文输入 即使用英文提示 若生成内容涉及中文效果会显著下降 [4] - 在涉及中文场景的画面时会出现错误 如无法正确生成中文字体 [28] - 在复杂构图指令方面仍存在缺陷 如偶尔会出现多肢体等结构错误 [4][32]