代理型(agentic)AI模型
搜索文档
经济学人:英美情报界如何使用AI模型?
搜狐财经· 2025-07-31 14:22
美国政府与AI实验室的合作 - 拜登政府下令情报机构、五角大楼及能源部更激进地试验尖端AI模型,并加强与Anthropic、谷歌DeepMind和OpenAI等前沿AI实验室的合作[1] - 2024年7月14日,五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI分别授予了最高达2亿美元的合同,用于测试能够代替用户执行任务、操控其他设备的“代理型”AI模型[1] AI在情报机构的应用现状 - 美国所有情报机构都在广泛使用来自多个实验室的AI模型,早期应用主要集中在利用大语言模型分析机密数据[2] - 微软公司26款云计算产品已获准用于美国情报机构,Anthropic推出的Claude Gov模型已部署在最高国家安全保密级别的情报机构中[2] - AI公司会根据情报机构需求对模型进行微调,例如Claude Gov版本被调校成允许处理带有“机密”标识的文件,并加强了对外语及方言的识别能力[2] - 这些模型大多运行在与互联网隔离的安全服务器上,一批新的“代理型”模型正在情报机构内部构建[2] 欧洲及以色列的AI应用进展 - 整个英国情报界(UKIC)都已接入最高保密级别的大语言模型功能,法国公司Mistral正与法国的国防人工智能局(AMIAD)开展合作[3] - Mistral的Saba模型专门训练了处理中东和南亚数据的能力,在阿拉伯语及泰米尔语等区域性语言上表现尤为出色[3] - 自加沙冲突爆发以来,以色列军方对OpenAI的GPT-4模型的使用频率增长了20倍[3] AI应用面临的挑战与局限性 - AI在国家安全领域的应用水平尚未达到预期,许多情报机构仍在试图为现成的聊天机器人构建自己的“封装器”,这种做法使其大幅落后于公共领域最先进的模型[4] - 情报界最需要的是AI模型的一致性、可靠性、透明度和可解释性,而各大实验室更关注研发更先进的“代理型”模型[6] - OpenAI最新的代理型模型ChatGPT agent的幻觉率约为8%,甚至高于早前发布的o3模型[6] - 有观点认为,如今的通用大语言模型架构并不适合“因果推理”,难以掌握真实世界运行的逻辑[7] 代理型AI模型的潜力与风险 - 代理型模型能够递归地为分配到的任务自行生成提示词,这使其更难预测,错误也可能层层累积[6] - Mistral公司展示了一种应用场景:每一种信息源(如卫星图像或语音拦截片段)都交给一个AI代理处理,从而加快决策速度[6] - 可以设想一个AI代理被指派去识别、研究并联系上百名伊朗核科学家,试图说服他们叛逃,但AI代理模型在战争情境中的使用方式还远未想清楚[6] 中美AI竞争态势 - 中国公司深度求索(DeepSeek)发布世界级大语言模型,这对美国AI行业敲响了“警钟”,美国情报界对此“被打了个措手不及”[1][8] - 有警告指出中国可能正在AI领域领先,其模型可能没有美国这样的“护栏”,因此可能更快地获得强大的洞察能力[7] - 美国情报界在监测中国AI进展、获取中国技术、渗透中国科技企业方面的进展仍然相当有限[8] - 特朗普政府已下令五角大楼与情报机构定期评估美国在AI领域的应用速度是否赶得上中国等竞争对手[7]