Workflow
Gemini 2.0 flash
icon
搜索文档
谷歌偷偷搞了个神秘模型Nano-Banana?实测:强到离谱,但有3大硬伤
36氪· 2025-08-26 18:02
模型背景与推测 - 神秘AI模型Nano-Banana在LMArena平台被发现但未公开列出且无官方开发者认领[1] - 网友推测其可能为谷歌研究模型 依据包括谷歌AI产品负责人发布香蕉表情符号[1]及DeepMind产品经理发布胶带香蕉艺术作品图片[2] - 其他推测依据包括谷歌曾将较小模型称为"Nano"且生成图像质感与Imagen或Gemini系列相似[4] 功能特点与技术表现 - 模型在文本编辑、风格融合和场景理解方面表现优异 支持上传两张图片并输入提示词融合元素[5] - 能精准理解复杂文本提示 例如将横放书本立起并添加书挡摆放至柜子[5] - 编辑后图片保留复杂细节如刺绣图案 同时保持光线、视角和构图一致性[8] - 在产品照片、场景搭建及广告等商业场景中表现稳定[10] - 存在生成缺陷 包括反射/光照逻辑不一致、物体位置错误及人物手指畸形 书籍文字可能出现乱码[13] 访问方式与市场乱象 - 目前仅能通过LMArena平台Battle模式随机体验 无官方API或正式官网链接[16] - 体验不稳定需靠运气遇到该模型[16] - 出现多个假网站声称提供Nano-Banana服务 造成用户混淆[16] 实测性能对比 - 文生图测试中生成化妆师图像 背景包含眼影盘/指甲油等职业相关元素 人物动作服装自然且手部无瑕疵[19][20] - 对比ChatGPT生成结果背景单一且存在拇指虚化问题[20] - 图片编辑功能可添加类人机器人至公园场景并完美融入环境[25] - 逆向工程功能可还原摄影棚布景过程 包括模特玩手机、发型师整理头发及工作人员悬挂幕布等细节[27] - 人物融合测试中成功将马斯克与奥特曼生成自拍照 但奥特曼形象严重失真[31][33] - 在融合扎克伯格与马斯克至风景照测试中 模型将二人完美融入环境但手指细节存在瑕疵 Gemini 2.0 Flash则完全无法识别名人[35] 进阶应用与生态整合 - 可与谷歌Veo3结合生成长视频 例如提取视频帧后通过Nano-Banana生成新场景再经Veo3动画化[37] - 支持将插画转化为手办模型 生成结果保留五官细节且真实感强 无明显AI痕迹[38][43] - 结合Gemini 2.5 Pro视频功能可将生成图片转化为8秒视频 需约1分钟处理时间[46] - 谷歌Veo3目前向所有Gemini用户免费开放至8月24日 每日限生成3个8秒视频 普通情况下该功能仅限Pro/Ultra订阅用户使用[46]
2天完成人类12年工作,AI自动更新文献综述,准确率碾压人类近15%
量子位· 2025-06-16 18:30
核心观点 - AI系统otto-SR在医学系统评价领域实现重大突破,仅用两天完成传统方法需12年的工作,效率提升显著[1][3][27] - otto-SR在灵敏度(96.7%)、特异度(93.9%)、数据提取准确率(93.1%)等关键指标上全面超越人类水平(81.7%/79.7%)[5][15][22] - 该系统发现人类遗漏的54篇关键研究,并将合格研究数量翻倍,显著提升临床决策质量[26][27][36] 技术实现 工作流程架构 - 基于GPT-4.1和o3-mini构建端到端自动化流程,涵盖文献筛选、数据提取至Meta分析全环节[7][9] - 采用RIS格式引用文献输入,Gemini 2.0 flash处理PDF转结构化Markdown[9] 筛选模块 - 筛选Agent在32357条引文测试中,摘要阶段灵敏度达96.6%(人类95.7%),全文阶段保持96.2%(人类骤降至63.3%)[13][15][16] - 通过优化提示策略整合综述目标与合格标准[11][12] 数据提取模块 - 提取Agent在495项研究对比中,93.1%准确率远超人类(79.7%)和Elicit(74.8%)[20][22] - 盲审小组在69.3%案例中支持AI结果,显著高于支持人类(28.1%)和Elicit(22.4%)的比例[22][23] 应用验证 Cochrane综述复现 - 对12篇综述146276条引文更新检索,识别64项新合格研究(含54篇人类遗漏项),错误纳入率仅0.07%[25][26] - Meta分析显示效应估计值与原始数据95%CI重叠,营养领域发现术前免疫增强可缩短住院时间1天[33][36] 效率革命 - 将16个月/10万美元的传统成本压缩至48小时,工作耗时从12人年降至2天[1][3][27] - 未来可能将数月工作缩短至分钟级,加速新疗法和大流行病响应[38] 行业影响 - 突破资金限制地区获取前沿医学的壁垒,重新定义系统评价黄金标准[39] - 技术路径展示LLM在科学研究的颠覆性潜力,可能引发医学研究范式变革[7][38]