Workflow
3毛钱生成刷屏3D手办图片,API调用成AI应用厂商落地“快车道”
第一财经·2025-09-05 18:54

谷歌NanoBanana模型发布 - 谷歌DeepMind实验室推出图像生成与编辑模型NanoBanana(内部代号,正式名称为Gemini 2.5 Flash Image),核心能力包括角色一致性、多图融合和自然语言交互 [3] - 模型通过Gemini APP、API等方式访问,API定价为每百万输出token 30美元,生成单张图片消耗约1290个输出token,成本约0.039美元(约0.277元人民币) [3] - 在LM Arena图像编辑榜单中以1362 Elo分排名第一,华福证券认为其优势包括跨图一致性、多图融合、精细编辑及基于Gemini世界知识的语义理解能力 [4] 模型性价比与行业定位 - NanoBanana定价处于行业中档水平,较GPT-Image-1中档价格略低,较Midjourney便宜约50%,但高于Stability AI与快手可灵AI的超低价档位 [4] - 凭借高质量生成能力形成高性价比优势,但存在生成失败率偏高、细节失真、图像细腻度不足等问题 [7] - 模型本质为高度逼真的二维图像生成工具,不支持直接生成3D打印格式文件(如.stl、.obj) [7] 下游应用与商业合作 - 爱诗科技旗下拍我AI平台国内首批接入NanoBanana,以Agent产品形态和API形式提供6天限时免费服务,后续付费模式未披露 [3][7] - 合作属于模型供应商-应用方关系,未涉及联合研发、品牌合作或资源互换 [7] - Adobe、Figma、Lovart、Genspark等企业均已接入模型,企业客户可通过Google AI Studio、Gemini API和Vertex AI快速集成功能 [8] 行业商业化趋势 - 券商机构将"应用厂商直接调用大模型API"视为AI赛道确定性商业主线,调用量大增、成本下降及场景颗粒化推动API经济闭环形成 [8] - 电商、金融、客服等场景已出现可量化案例,浙商证券认为产品矩阵闭环构建者及垂直场景企业服务商更具竞争优势 [8] - 企业客户可通过API调用模型功能,应用于广告、产品展示及教育等场景 [1][8]