Workflow
Gemini 2.0 flash
icon
搜索文档
谷歌偷偷搞了个神秘模型Nano-Banana?实测:强到离谱,但有3大硬伤
36氪· 2025-08-26 18:02
不过很多网友循着蛛丝马迹,猜测这可能是谷歌的研究模型。 上周二,谷歌 AI Studio 产品负责人 Logan Kilpatrick 在 X 上发布了一个香蕉表情符号。 谷歌 DeepMind 产品经理 Naina Raisinghani 也发布了一张与意大利艺术家 Maurizio Cattelan 2019 年创作的胶带粘贴香蕉艺术作品类似的图片。 再加上谷歌过去曾将其较小的模型称为「Nano」,而且其生成图像的质感与 Google 的 Imagen 或 Gemini 系列相似。 神秘AI模型Nano-Banana火了,冒出一堆假网站,李鬼和李逵傻傻分不清。 最近,AI 社区又冒出一个神秘的图像生成和编辑模型,名叫 Nano-Banana。 起初它在 LMArena 平台的「Battle」模式中被发现,但未在公开排行榜上列出,也没有官方开发者明确声称其归属。 以上种种,似乎都在暗示它出自谷歌之手。 该模型不仅在文本编辑、风格融合和场景理解等方面表现更优,还可以上传两张图片、输入提示词将其中的元素融合。 比如,上传一摞书和卧室床头柜的图片,输入提示词「Flip stack of books to be u ...
2天完成人类12年工作,AI自动更新文献综述,准确率碾压人类近15%
量子位· 2025-06-16 18:30
核心观点 - AI系统otto-SR在医学系统评价领域实现重大突破,仅用两天完成传统方法需12年的工作,效率提升显著[1][3][27] - otto-SR在灵敏度(96.7%)、特异度(93.9%)、数据提取准确率(93.1%)等关键指标上全面超越人类水平(81.7%/79.7%)[5][15][22] - 该系统发现人类遗漏的54篇关键研究,并将合格研究数量翻倍,显著提升临床决策质量[26][27][36] 技术实现 工作流程架构 - 基于GPT-4.1和o3-mini构建端到端自动化流程,涵盖文献筛选、数据提取至Meta分析全环节[7][9] - 采用RIS格式引用文献输入,Gemini 2.0 flash处理PDF转结构化Markdown[9] 筛选模块 - 筛选Agent在32357条引文测试中,摘要阶段灵敏度达96.6%(人类95.7%),全文阶段保持96.2%(人类骤降至63.3%)[13][15][16] - 通过优化提示策略整合综述目标与合格标准[11][12] 数据提取模块 - 提取Agent在495项研究对比中,93.1%准确率远超人类(79.7%)和Elicit(74.8%)[20][22] - 盲审小组在69.3%案例中支持AI结果,显著高于支持人类(28.1%)和Elicit(22.4%)的比例[22][23] 应用验证 Cochrane综述复现 - 对12篇综述146276条引文更新检索,识别64项新合格研究(含54篇人类遗漏项),错误纳入率仅0.07%[25][26] - Meta分析显示效应估计值与原始数据95%CI重叠,营养领域发现术前免疫增强可缩短住院时间1天[33][36] 效率革命 - 将16个月/10万美元的传统成本压缩至48小时,工作耗时从12人年降至2天[1][3][27] - 未来可能将数月工作缩短至分钟级,加速新疗法和大流行病响应[38] 行业影响 - 突破资金限制地区获取前沿医学的壁垒,重新定义系统评价黄金标准[39] - 技术路径展示LLM在科学研究的颠覆性潜力,可能引发医学研究范式变革[7][38]