Gemini准确率从21%飙到97%,谷歌只用了这一招:复制粘贴
36氪·2026-01-19 20:33

核心观点 - Google Research发现一种极其简单的提示词技巧——将输入问题重复一遍,能显著提升主流大语言模型在非推理任务上的准确率,最高提升达76个百分点,且几乎不增加延迟或成本,堪称“免费午餐” [1][2][5] 技术发现与效果 - 在要求模型不进行显式推理、只给直接答案的非推理任务中,简单的“提示词重复”在70组正面对比中,赢了47组,输了0组,其余为平局 [5][7] - 在名为“NameIndex”的精确检索测试中,Gemini 2.0 Flash-Lite的准确率从21.33%飙升至97.33%,提升76个百分点 [1][7][28] - 该技巧主要适用于信息检索、抽取、分类及简单问答等非推理任务,但不适用于需要逐步推导的复杂推理场景 [31][32][39] 技术原理 - 效果提升源于Transformer架构的“因果盲点”:模型严格从左到右处理文本,无法在阅读时“回头看”后续信息 [9][10][13] - 重复输入提示词()使得模型在处理第二遍内容时,能“注意”到第一遍的完整信息,从而获得一种“类双向注意力”效果,更准确地对齐任务上下文 [14] 效率与成本优势 - 提示词重复带来的用户感知延迟几乎可忽略不计,因为模型处理输入内容的“预填充”阶段是高度并行的,现代GPU能高效处理 [18][22][23][24] - 该技巧不会让生成的答案变长,也不会让大多数模型的“首字延迟”变慢 [25] - 这意味着开发者无需为追求准确率而升级到更大、更贵、更慢的模型,轻量级模型经此优化后,在检索任务上可打平甚至超越未优化的顶配模型 [26][27][29] 应用边界与安全影响 - 该技巧与需要逐步思考的“思维链”方法结合时效果不佳,在28次测试中仅赢5次、输1次、平22次,推测因推理模型自身会复述题目,人工重复可能打断其思路 [33][34][37][38] - 重复可能放大某些指令的显著性,需警惕其潜在安全风险,例如“重复注入”攻击可能更容易让模型突破安全护栏 [40][41][43] - 反过来,该机制也可用于增强防御,例如在系统提示词中重复安全规则,可能成为一种低成本的模型加固方式 [44][45]