NanoBanana(谷歌Gemini 2.5 Flash Image)
搜索文档
3毛钱生成刷屏3D手办图片,API调用成AI应用厂商落地“快车道”
第一财经· 2025-09-05 22:30
拍我AI限时免费活动与NanoBanana技术整合 - 爱诗科技旗下AI视频生成平台拍我AI于9月5日开启为期六天的限时免费活动,国内用户可免费体验PixVerse Agent创作助手[5] - 拍我AI成为国内首批嵌入谷歌NanoBanana(内部代号,正式名称为Gemini 2.5 Flash Image)的AI视频生成平台,吸引大量创作者体验[5] - 活动结束后付费模式暂未披露,拍我AI与谷歌暂未形成联合研发或资源互换,属于模型供应商与应用方关系[10] NanoBanana模型核心能力与市场定位 - NanoBanana由谷歌DeepMind实验室推出,核心亮点包括角色一致性、多图融合能力和自然语言交互[5] - 模型主打四方面能力:跨图一致性、多图融合、对话式/指令式精细编辑,以及借助Gemini世界知识带来的更强常识与语义理解[7] - API定价为每百万输出token30美元,生成单张图片约消耗1290个输出token,折算成本约0.039美元(约0.277元人民币)[5] - 在LM Arena图像编辑榜以1362 Elo分位列第一,被业内视为"AI模型高考放榜"[7] NanoBanana性价比优势与行业对比 - 定价约为行业中档水平,较GPT-Image-1中档价格略低,较Midjourney便宜约50%,但高于Stability AI与快手可灵AI的"超低价"档位[6] - 由于生成质量较高,呈现更高性价比优势,中档价格叠加高质量图片生成能力是其重要竞争力[6] 模型技术局限性与市场认知澄清 - 生成过程中存在失败率偏高、细节轻微失真或马赛克感等问题,对图像质量要求极高的用户可能认为生成不够细腻[9] - 模型本质是高度逼真的二维图片生成,不能直接生成3D打印所需的stl或obj格式文件,属于图像生成和风格迁移能力体现,而非真正Text-to-3D技术[9] 下游应用生态与行业趋势 - 除拍我AI外,Adobe、Figma、Lovart、Genspark等产品均已接入NanoBanana[10] - 企业客户可通过Google AI Studio、Gemini API和Vertex AI等渠道快速集成图像生成功能,应用于广告、产品展示或教育等场景[10] - 券商机构将"应用厂商直接调用大模型API"视为AI赛道确定性商业主线,调用量大增、成本下降和场景颗粒化正构成API经济闭环[10]