Nano banana
搜索文档
我用AI生成流浪汉骗我爸,结果他摇来了特警
36氪· 2025-11-27 14:18
AI恶作剧趋势 - TikTok用户mmmjoemele于10月发布首个“AI流浪汉进家门”恶作剧视频,通过录屏展示其用AI生成图片欺骗父亲家中有流浪汉闯入的过程,视频在3分钟内引发父亲拨打21个电话并试图报警,该视频在TikTok获得近92万播放量[2] - 恶作剧迅速形成风潮,TikTok上homelessmanprank词条下已有超过1600个相关视频,播放量动辄上百万,创作者多为青少年,使用Snapchat、Nano banana等AI工具生成流浪汉图片欺骗家人,并录下其惊慌反应上传社交媒体[4] - 趋势从海外蔓延至本土平台,抖音、小红书等中文社区出现大量模仿内容,例如一条“整蛊父母”视频通过微信聊天记录展示儿子用AI流浪汉图片欺骗父亲,父亲拎扫帚赶回家中,视频点赞量超过40万[6][9][12] AI内容滥用风险 - 恶作剧导致实际报警事件频发,警方将“家中闯入”报案列为高优先级,可能动用大规模警力甚至特警,Round Rock警局指挥官指出此类行为浪费资源并造成潜在危险[7][23] - 抖音评论区有用户分享因孩子恶作剧报警后,警方出动四五辆警车,最终需反复道歉并接受教育,另有近9000点赞评论表达对AI技术滥用的担忧[15] - 滥用AI生成内容的问题不仅限于恶作剧,德勤为澳大利亚政府撰写的44万澳元评估报告因使用GPT-4o等工具掺杂虚假内容需赔偿,香港大学学生用AI制作女性不雅照,IWF调查显示AI生成的儿童性虐待视频2025年上半年达1286个,同比激增400%[21] 行业监管动态 - 中国互联网联合辟谣平台多次通报利用AI造谣现象,网信部门启动专项整治,要求AI生成内容显著标识来源并追究恶意使用者责任[23] - 美国塞勒姆警察局声明强调恶作剧丑化流浪汉形象、造成受害者恐慌及警察资源浪费,呼吁考虑后果[23]
我们用21款AI修图工具修了100张图:谁才是真正的“修图神器”?|Jinqiu Scan
锦秋集· 2025-11-10 19:38
文章核心观点 - 文章对21款AI修图工具进行了六轮严格测评,旨在评估其在真实场景下的图像编辑能力,核心观点是当前AI修图工具能力差距悬殊,尚无产品能完美应对所有需求,但用户可根据特定任务选择合适工具以提升效率[4][141][149] 测评工具与思路 - 测评涵盖21款主流AI修图工具,包括Nano banana(Gemini 2.5 Flash)、即梦4.0、Kling、腾讯元宝(混元模型)、美图秀秀、文心一言、Sora、Qwen Image edit、Runway等[8][9][10] - 测评采用六轮测试,每轮使用相同提示词,模型均采用最新版默认配置,不调整任何参数[11] - 通用测评维度包括视觉一致性、局部质量和内容一致性,每项评分0-5分[12][13][14][15] 局部擦除/修补测评结果 - 腾讯元宝、美图秀秀和Qwen Image edit获得15分满分,完美满足提示词要求且图片更清晰无违和感[18][23] - Nano banana、Sora、Lovart、Manus和Runway获得14分,主要扣分点为未完全消除干净人物[18][28][29] - 即梦4.0、醒图、像素蛋糕和Genspark得分在10-11分,能较好完成需求但出现明显错误如格局改动或图片模糊[18][30][31][32] - Kling、文心一言、Grok、智谱清言和天工得分在5-7分,存在未按原图修改或人物面貌改动等问题[18][32][33] - CanvaAI、Pixlr和SenseMirage未完成需求,出现严重错误如图片卡通化或随机生成[18][34] 图片抠图测评结果 - Qwen Image edit与Genspark获得15分满分,后者是唯一完全使用抠图技术保持原图格局与元素的产品[41][42] - Nano banana、即梦4.0、腾讯元宝、美图秀秀、Lovart、Manus、天工和Runway为第二梯队,多数产品存在少提取或多提取机器人问题[47][48][49] - Kling、CanvaAI、Grok、文心一言、SenseMirage和智谱清言得分在4-7分,普遍问题为生成动漫图而非抠图,或元素处理错误[50][51][52][53][54][55][56] - 醒图和像素蛋糕无此功能未参与测评,Pixlr完全随机生成图片[57] 图片替换测评结果 - 即梦4.0、腾讯元宝、Qwen Image edit、Manus和Runway获得15分满分,完美完成服饰更换和细节重建[62][65] - Nano banana和美图秀秀得分14分,前者因绳子未清除扣分,后者因人物面部特征改变扣分[62][70][71] - Kling、文心一言、Sora、Grok、Genspark和智谱清言得分在4-7分,普遍问题为未按原图修改或人物面貌改变[62][72][73] - CanvaAI、Pixlr和SenseMirage产生严重错误,如完全不符合要求或图片卡通化[62][74] 图片合成测评结果 - 本轮无满分产品,Sora和Runway表现最佳,得分14分,仅存在轻微面部变形或违和感[78][81][82][83] - Nano banana、即梦4.0和Manus得分13分,存在违和感或人物面貌改变问题[78][84][85] - Qwen Image edit、Lovart、智谱清言和天工得分10分,出现元素遗漏或人物生成错误[78][86][87][88][89][90] - Kling和Genspark得分较低,分别为7分和6分,存在未按要求生成或割裂感高问题[78][91][92][93] - CanvaAI、文心一言和Grok表现最差,生成图片不符合要求或元素错误[78][94][95][96][97] 图上文字修改测评结果 - 本轮所有产品均不达预期,无高分产品,第一梯队得分11-12.5分,包括Nano banana、即梦4.0、美图秀秀、Qwen Image edit、Manus、天工和Runway[106][107] - 产品普遍存在英文未改变、时间未修改、地点乱码或排版错误等问题[108][109][110][111][112][113] - 第二梯队得分7-10分,包括Lovart、Genspark和智谱清言,问题包括文字乱码或重新生成图片[114][115][116][117] - 文心一言和Grok得分5分左右,细节修改部分几乎全军覆没[118][119][120][121] - Kling、CanvaAI、Pixlr和SenseMirage表现最差,细节处理基本错误且改变原格局[122][123] 画质增强/修复测评结果 - 美图秀秀、Sora、Qwen Image edit、Lovart、Genspark和Manus获得10分满分,完美实现图片清晰化和彩色化[127][133] - Nano banana、即梦4.0、腾讯元宝、醒图、像素蛋糕和Runway得分8-9分,问题包括分辨率不足或无法自动上色[127][136][137][138][139] - CanvaAI、文心一言、智谱清言和SenseMirage重新生成图片,人物面貌或格局发生改变[127][140] 行业洞察与挑战 - 专业工具与通用模型对比明显,美图秀秀等传统软件在核心功能上保持优势,而Qwen等通用模型展现后发优势[141][147] - AI修图最大挑战是“修图”与“生图”的混淆,部分模型如文心一言、智谱清言倾向于重新生成图片而非修改原图[141][148] - 文字处理能力是行业短板,所有产品在文字修改测试中均未高分,显示精细化编辑能力不足[141][148] - 复杂合成能力不足,多元素理解力欠缺,导致结果违和或元素遗漏[141][148]
Nano-Banana核心团队首次揭秘,全球最火的AI生图工具是怎么打造的
创业邦· 2025-09-03 18:10
技术能力提升 - Nano Banana模型实现图像生成和编辑功能的重大质量飞跃 生成速度快 能理解模糊和口语化指令 并在多轮编辑中保持角色和场景一致性 效果更自然[5][9] - 模型具备强大的世界知识 能根据上下文进行创造性解释 例如将"make it nano"解释为生成迷你版角色[11] - 文本渲染能力成为评估图像生成效果的关键指标 当模型能生成有结构的文字时 也能更好地学习图像中的结构[13][16] - 采用交错式生成(Interleaved Generation)技术 使模型能分步骤处理复杂指令 逐步构建复杂图像 而非一次性生成所有内容[18][30][33] - 实现像素级精确编辑 能保持画面其他部分不变的情况下修改特定元素[26] - 生成单张图像速度仅需13秒 支持快速迭代创作[28] 模型架构优势 - 基于Google多个团队的项目成果 结合Gemini的世界知识与指令遵循能力 以及Imagen模型的图像美学追求[3] - 原生多模态能力使图像理解和图像生成像"姐妹"一样密切相关 不同模态间产生正迁移[18] - 具备对多模态上下文的访问能力 能在图像和文本之间进行协调与理解[21] - 相比专门化模型Imagen Nano Banana更适合复杂多模态工作流 包括多轮编辑和创意探索[35][37] - 可接受图像作为参考输入 更好地理解生成提示[39] 开发与评估方法 - 通过提升文本渲染效果来同时提升生成图像质量[5][13] - 收集用户反馈构成基准数据集 持续追踪和改进常见失败模式[42][44] - 结合Gemini团队和Imagen团队的专长 既注重指令执行和世界知识 也关注图像自然度和美观度[48] - 团队具备专业美学判断能力 能通过人工评估成千上万张图像来比较模型表现[49] 未来发展方向 - 不仅追求视觉质量提升 更注重模型智能和事实准确性[6][51] - 目标是打造能理解用户深层意图 甚至能超越用户提示词提供更好创意的聪明模型[6][51] - 致力于提高数据保真度 特别是在工作场景中生成准确可用的图表和信息图[52][53][57] - 最终愿景是将所有模态整合进Gemini 从知识迁移中受益并向通用人工智能(AGI)迈进[35]
Nano Banana官方提示词来了,附完整代码示例
量子位· 2025-09-03 13:49
Nano Banana技术功能概述 - 谷歌推出Nano Banana官方提示词指南 旨在优化AI图像生成效果[1][8] - 工具支持多模态生成能力 包括图像编辑、风格转换及高保真文本渲染[15] - 可生成动画视频及无缝换脸效果 展示技术突破性应用场景[5][6] 核心生成功能分类 - 文本转图像:通过详细场景描述生成高质量图像 如猫猫在星空餐厅的精细化场景[13][14][17] - 图像+文本编辑:通过文本提示添加/删除元素或调整风格色彩[15] - 多图像合成:将多张输入图像组合为新场景或进行风格转换[15] - 迭代细化:通过多次对话微调图像直至达到理想效果[15] - 文本渲染:精准生成带文字图像 适用于logo和海报等商业场景[15] 逼真场景生成方法论 - 采用摄影师思维模式 需指定相机角度、镜头类型及光线细节[19] - 标准提示模板包含镜头类型、主体动作、环境光照及画幅比例等要素[20] - 实际案例生成日本陶艺家特写 使用85mm人像镜头营造柔焦背景效果[21][23] 风格化内容创作应用 - 插画与贴纸生成需明确艺术风格并指定白色背景[24][25] - 文本渲染需描述具体内容、字体风格及整体设计规范[30] - 案例包括卡哇伊风格小熊贴纸和极简咖啡店logo设计[29][32][34] 商业摄影与产品建模 - 支持高分辨率产品摄影 适用电子商务与广告场景[35] - 标准模板包含灯光设置、拍摄角度及产品细节特写[35] - 案例展示哑光黑陶瓷杯在混凝土表面的工作室级拍摄效果[37] 极简设计与叙事创作 - 极简构图擅长创造负空间 适合作为文本覆盖的背景模板[38][39] - 案例呈现右下角红枫叶与灰白背景的简约设计[41] - 连环画生成功能可创建故事板 需定义艺术风格、角色动作及对话文本[44][45][47]
Nano-Banana核心团队首次揭秘,全球最火的 AI 生图工具是怎么打造的
36氪· 2025-09-02 09:29
模型技术特点 - Nano banana实现图像生成和编辑功能的巨大质量飞跃 生成速度快 能理解模糊和口语化指令 并在多轮编辑中保持角色和场景一致性 效果更自然 [6] - 模型具备原生多模态能力 特别是交错式生成功能 可像人类一样分步骤处理复杂指令 联系上下文进行创作 而非一次性生成所有内容 [6][20][21] - 文本渲染能力提升成为评估图像生成效果的有效指标 当模型能生成有结构文字时 也能更好学习图像中的结构 [13][15][18] - 每个图像生成仅需13秒 支持快速迭代创作 用户可快速重新生成并修改提示词 [30][31] - 交错生成带来全新范式 可将复杂提示拆解为多个步骤 通过增量生成方式构建复杂图像 [32][34][35] 模型能力比较 - Imagen模型定位专业文本生成图像 在成本和响应速度上高效 适合需要快速生成高质量图像的场景 [36][37] - Nano banana作为多模态创意伙伴 适合多轮编辑和创意探索等复杂工作流 具备世界知识理解能力 [6][36][39] - 原生图像生成模型可插入图像作为参考 在理解提示词意图方面表现更出色 [40][42] 团队协作与改进 - 结合Gemini团队的世界知识与指令遵循能力 以及Imagen团队的图像美学追求 实现技术融合 [3][49] - 通过收集用户反馈构建基准数据集 持续跟踪常见失败模式并改进模型表现 [43][45] - Imagen团队贡献了自然美观的审美判断 显著改善图像生成质量 [49] 应用场景 - 支持像素级精确编辑 可只改动图像中特定元素而保持其他部分不变 [27][29] - 可实现角色多角度渲染和场景重构 将物体放入完全不同的新场景中进行真实融合 [46] - 适用于广告设计 室内装饰 角色设定等多种创意场景 [26][27][40] 未来发展方向 - 未来目标不仅是提升视觉质量 更追求模型智能性和事实准确性 [7][51][54] - 致力于打造能理解用户深层意图 甚至超越用户提示词创造更好结果的聪明模型 [7][51] - 重点改进数据保真能力 确保工作用图表和信息图既美观又准确 [54][57]