代理型AI模型 - 财报，业绩电话会，研报，新闻

代理型AI模型

搜索文档

观察者网· 2025-07-31 13:52

美国政府对AI的国家安全应用与投入 - 拜登政府下令情报机构、五角大楼及能源部更激进地试验尖端AI模型，并加强与Anthropic、谷歌DeepMind和OpenAI等前沿AI实验室的合作[1] - 五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI等企业分别授予了最高达2亿美元的合同，以测试能够代替用户执行任务的“代理型”AI模型[1] - 特朗普政府下令五角大楼与情报机构定期评估美国在AI领域的应用速度是否赶得上中国等竞争对手，并要求制定持续适应的机制[8] AI公司在情报与国防领域的业务进展 - 微软公司表示其26款云计算产品已获准用于美国情报机构[2] - Anthropic宣布推出专为政府设计的Claude Gov模型，该模型已部署在拥有最高国家安全保密级别的情报机构中，并允许处理带有“机密”标识的文件[2] - AI公司会根据情报机构的需求对模型进行微调，例如加强对外语及方言的识别与理解能力，这些模型大多运行在与互联网隔离的安全服务器上[2] 欧洲及以色列的AI军事与情报应用 - 法国AI领军企业Mistral正与法国的国防人工智能局合作，其Saba模型专门训练了处理中东和南亚数据的能力，在阿拉伯语及泰米尔语等区域性语言上表现尤为出色[3] - 整个英国情报界都已接入了最高保密级别的大语言模型功能，并采用“检索增强生成”方法来降低模型的幻觉率[3][6] - 自加沙冲突爆发以来，以色列军方对OpenAI的GPT-4模型的使用频率增长了20倍[3] AI技术在国家安全应用中的挑战与局限性 - OpenAI负责人坦言AI在国家安全领域的应用还远没有达到期望的水平，许多情报机构仍在试图为现成的聊天机器人构建自己的“封装器”，这种做法使其大幅落后于公共领域中最先进的模型[4] - 美英情报机构希望实验室能显著降低现有大语言模型的“幻觉”率，情报界最需要的是模型的一致性、可靠性、透明度和可解释性[6] - OpenAI最新的代理型模型ChatGPT agent的幻觉率约为8%，甚至高于早前发布的o3模型，代理型模型因递归生成提示词而更难预测，错误可能层层累积[6] 关于AI未来发展方向与架构的争论 - 有观点认为如今的通用大语言模型架构并不适合“因果推理”，难以掌握真实世界运行的逻辑，主张情报机构的重点应转向开发具备推理能力的全新AI架构[7] - 有警告指出中国可能在该领域领先，其模型可能没有西方这样的“护栏”，因此可能更快地获得强大的洞察能力，但外界对中国如何及在多大程度上将DeepSeek应用于军事和情报领域仍不清楚[7] 美国对竞争对手AI进展的担忧 - 美国参议院情报委员会副主席马克·华纳直言，美国情报界在监测中国相关进展方面做得“一塌糊涂”，在获取中国技术、渗透中国科技企业方面的进展仍然相当有限[8] - 最大问题被指并非美国在风险不明的情况下贸然推进AI技术，而是国防部和情报界继续按老办法做事，担忧可能赢下通用人工智能的竞赛却输掉它的实际应用[8]