Workflow
Claude Gov
icon
搜索文档
经济学人:英美情报界如何使用AI模型?
搜狐财经· 2025-07-31 14:22
美国政府与AI实验室的合作 - 拜登政府下令情报机构、五角大楼及能源部更激进地试验尖端AI模型,并加强与Anthropic、谷歌DeepMind和OpenAI等前沿AI实验室的合作[1] - 2024年7月14日,五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI分别授予了最高达2亿美元的合同,用于测试能够代替用户执行任务、操控其他设备的“代理型”AI模型[1] AI在情报机构的应用现状 - 美国所有情报机构都在广泛使用来自多个实验室的AI模型,早期应用主要集中在利用大语言模型分析机密数据[2] - 微软公司26款云计算产品已获准用于美国情报机构,Anthropic推出的Claude Gov模型已部署在最高国家安全保密级别的情报机构中[2] - AI公司会根据情报机构需求对模型进行微调,例如Claude Gov版本被调校成允许处理带有“机密”标识的文件,并加强了对外语及方言的识别能力[2] - 这些模型大多运行在与互联网隔离的安全服务器上,一批新的“代理型”模型正在情报机构内部构建[2] 欧洲及以色列的AI应用进展 - 整个英国情报界(UKIC)都已接入最高保密级别的大语言模型功能,法国公司Mistral正与法国的国防人工智能局(AMIAD)开展合作[3] - Mistral的Saba模型专门训练了处理中东和南亚数据的能力,在阿拉伯语及泰米尔语等区域性语言上表现尤为出色[3] - 自加沙冲突爆发以来,以色列军方对OpenAI的GPT-4模型的使用频率增长了20倍[3] AI应用面临的挑战与局限性 - AI在国家安全领域的应用水平尚未达到预期,许多情报机构仍在试图为现成的聊天机器人构建自己的“封装器”,这种做法使其大幅落后于公共领域最先进的模型[4] - 情报界最需要的是AI模型的一致性、可靠性、透明度和可解释性,而各大实验室更关注研发更先进的“代理型”模型[6] - OpenAI最新的代理型模型ChatGPT agent的幻觉率约为8%,甚至高于早前发布的o3模型[6] - 有观点认为,如今的通用大语言模型架构并不适合“因果推理”,难以掌握真实世界运行的逻辑[7] 代理型AI模型的潜力与风险 - 代理型模型能够递归地为分配到的任务自行生成提示词,这使其更难预测,错误也可能层层累积[6] - Mistral公司展示了一种应用场景:每一种信息源(如卫星图像或语音拦截片段)都交给一个AI代理处理,从而加快决策速度[6] - 可以设想一个AI代理被指派去识别、研究并联系上百名伊朗核科学家,试图说服他们叛逃,但AI代理模型在战争情境中的使用方式还远未想清楚[6] 中美AI竞争态势 - 中国公司深度求索(DeepSeek)发布世界级大语言模型,这对美国AI行业敲响了“警钟”,美国情报界对此“被打了个措手不及”[1][8] - 有警告指出中国可能正在AI领域领先,其模型可能没有美国这样的“护栏”,因此可能更快地获得强大的洞察能力[7] - 美国情报界在监测中国AI进展、获取中国技术、渗透中国科技企业方面的进展仍然相当有限[8] - 特朗普政府已下令五角大楼与情报机构定期评估美国在AI领域的应用速度是否赶得上中国等竞争对手[7]
英美情报界如何使用AI模型?
观察者网· 2025-07-31 13:52
美国政府对AI的国家安全应用与投入 - 拜登政府下令情报机构、五角大楼及能源部更激进地试验尖端AI模型,并加强与Anthropic、谷歌DeepMind和OpenAI等前沿AI实验室的合作[1] - 五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI等企业分别授予了最高达2亿美元的合同,以测试能够代替用户执行任务的“代理型”AI模型[1] - 特朗普政府下令五角大楼与情报机构定期评估美国在AI领域的应用速度是否赶得上中国等竞争对手,并要求制定持续适应的机制[8] AI公司在情报与国防领域的业务进展 - 微软公司表示其26款云计算产品已获准用于美国情报机构[2] - Anthropic宣布推出专为政府设计的Claude Gov模型,该模型已部署在拥有最高国家安全保密级别的情报机构中,并允许处理带有“机密”标识的文件[2] - AI公司会根据情报机构的需求对模型进行微调,例如加强对外语及方言的识别与理解能力,这些模型大多运行在与互联网隔离的安全服务器上[2] 欧洲及以色列的AI军事与情报应用 - 法国AI领军企业Mistral正与法国的国防人工智能局合作,其Saba模型专门训练了处理中东和南亚数据的能力,在阿拉伯语及泰米尔语等区域性语言上表现尤为出色[3] - 整个英国情报界都已接入了最高保密级别的大语言模型功能,并采用“检索增强生成”方法来降低模型的幻觉率[3][6] - 自加沙冲突爆发以来,以色列军方对OpenAI的GPT-4模型的使用频率增长了20倍[3] AI技术在国家安全应用中的挑战与局限性 - OpenAI负责人坦言AI在国家安全领域的应用还远没有达到期望的水平,许多情报机构仍在试图为现成的聊天机器人构建自己的“封装器”,这种做法使其大幅落后于公共领域中最先进的模型[4] - 美英情报机构希望实验室能显著降低现有大语言模型的“幻觉”率,情报界最需要的是模型的一致性、可靠性、透明度和可解释性[6] - OpenAI最新的代理型模型ChatGPT agent的幻觉率约为8%,甚至高于早前发布的o3模型,代理型模型因递归生成提示词而更难预测,错误可能层层累积[6] 关于AI未来发展方向与架构的争论 - 有观点认为如今的通用大语言模型架构并不适合“因果推理”,难以掌握真实世界运行的逻辑,主张情报机构的重点应转向开发具备推理能力的全新AI架构[7] - 有警告指出中国可能在该领域领先,其模型可能没有西方这样的“护栏”,因此可能更快地获得强大的洞察能力,但外界对中国如何及在多大程度上将DeepSeek应用于军事和情报领域仍不清楚[7] 美国对竞争对手AI进展的担忧 - 美国参议院情报委员会副主席马克·华纳直言,美国情报界在监测中国相关进展方面做得“一塌糊涂”,在获取中国技术、渗透中国科技企业方面的进展仍然相当有限[8] - 最大问题被指并非美国在风险不明的情况下贸然推进AI技术,而是国防部和情报界继续按老办法做事,担忧可能赢下通用人工智能的竞赛却输掉它的实际应用[8]
9点1氪:王自如宣布进军AI赛道,直言“来钱快”;上百名员工食物中毒,字节跳动起诉云海肴;北大“韦神”韦东奕开设社交账号
36氪· 2025-06-06 23:36
王自如转型AI测评UP主 - 王自如B站账号复更并改名为"王自如AI",宣布以AI测评UP主身份二次创业,高度聚焦AI应用领域[1] - 表示将用AI技术帮助传统产业加速数字化转型,直言选择该赛道因"来钱快"[1] - 透露在格力期间重塑了销售、仓储、物流、终端到售后的整个销售体系[1] 字节跳动员工食物中毒事件 - 云海肴因2024年字节跳动新加坡办公处集体食物中毒案被告上法庭,涉及130人出现肠胃不适症状[2] - 事件发生于2024年7月30日,新加坡食品局确认中毒与云海肴和莆田供应的食物有关[2] 永辉超市门店改造进展 - 永辉超市第100家胖东来模式调改店将于6月13日在南京开业[2] - 调改进入规模化、系统化阶段,未来将全面对标胖东来的商品品质和价格[2] 家电以旧换新补贴情况 - 重庆等地家电"国补"暂停,因前期12亿元补贴资金已用完[3] - 专家表示第二批资金正在拨付,第三批资金规划中,预计短期调整后将恢复[3] 西子电梯董事长离世 - 西子电梯董事长兼总经理刘文超于6月2日在杭州离世,终年54岁[3] - 公司总投资超8.1亿元,业务覆盖70余个国家和地区,拥有180多项专利[4] 人人乐超市退市 - 人人乐因2024年净资产-4.04亿元触及终止上市情形,将于7月4日正式退市[5] - 股票6月13日进入退市整理期,证券简称变更为"人乐退"[5] 比亚迪"反内卷"倡议 - 提出4点倡议:拒绝夸大宣传、拒绝透支式营销、抵制拉踩、打击造谣[5] - 表示将通过科技创新实现"反内卷"[5] 万科融资动态 - 深铁集团拟向万科提供不超过30亿元借款,利率2.34%,期限不超过36个月[7] - 资金用于偿还公开市场债券本息及指定借款利息[7] 美团无人机业务拓展 - 美团无人机香港首条常态化航线投入运营,连接科学园与马鞍山海滨长廊[8] - 香港麦当劳、必胜客等商户已接入服务[8] 科技公司融资动态 - 北方康源完成2亿元A轮融资,资金用于光伏、储能项目开发[20] - 国奥科技完成数千万元A轮融资,资金用于扩大产能及高端半导体等领域研发[21] 零售与消费品表现 - lululemon第一季度全球净营收24亿美元,同比增长7%,中国大陆增长21%[16] - 巴黎世家推出"北京烤鸭"包袋,售价15500元,采用意大利顶级牛皮[11] 医疗科技进展 - 睿心医疗发布冠状动脉功能测量系统AngioQFA 100,融合AI与3D仿真技术[17][18] - 时代天使发布首款口腔扫描仪AngelScanner A8,提升扫描速度与精度[19] AI与科技发展 - Anthropic推出政府专用AI模型Claude Gov,获亚马逊和谷歌支持[14] - PixVerse发布国内版"拍我AI",全球用户超6000万,MAU达1600万[14] - 智源研究院发布"悟界"系列大模型,包括多模态世界模型Emu3等[15]
谷歌(GOOGL.US)推出Gemini 2.5 Pro升级预览版 编码能力有所提升
智通财经· 2025-06-06 12:11
谷歌Gemini 2 5 Pro模型升级 - 谷歌宣布推出Gemini 2 5 Pro I/O版的升级预览版 该版本提高了编码能力 特别是构建交互式网络应用程序的能力 [1] - 新模型将在几周内成为普遍可用的稳定版本 可供企业级应用使用 [1] - 最新2 5 Pro模型在LMArena上的Elo得分上升24分 在WebDevArena上的Elo得分上升35分至1443分 保持领先地位 [1] - 该模型在高难度编码基准测试Aider Polyglot中保持领先 并在GPQA和Humanity's Last Exam等评估数学 科学 知识和推理能力的基准测试中表现出色 [1] 人工智能行业竞争动态 - Gemini的竞争对手包括微软支持的OpenAI Meta Platforms和Anthropic等公司的人工智能产品 [1] - 由亚马逊和谷歌支持的Anthropic发布了专门为美国国家安全客户打造的Claude Gov模型 [2] - Meta在4月发布了一款基于Llama 4 LLM的新独立应用 将与Gemini ChatGPT DeepSeek和xAI的Grok等其他聊天机器人应用竞争 [2]