OpenAI发布GPT-4.1，价格更低背景下全面超越GPT-4o

报告行业投资评级 - 维持计算机板块“增持”评级 [4] 报告的核心观点 - GPT - 4.1系列模型发布凸显AI业界“性能提升同时降低成本”趋势，将吸引开发者接入OpenAI的API，推动AI应用开发和业务拓展，提升OpenAI市场竞争力，为产业链带来投资机会，刺激科技股市场活跃度，推动人工智能板块估值提升 [4] 根据相关目录分别进行总结 GPT - 4.1系列模型发布情况 - 4月15日，OpenAI在API中推出GPT - 4.1、GPT - 4.1 mini和GPT - 4.1 nano三款新模型，各方面均优于GPT - 4o和GPT - 4o mini，支持最大100万个tokens的上下文窗口，长上下文理解能力更强 [4] GPT - 4.1系列模型成本优势 - 通过优化推理系统，GPT - 4.1系列使用成本降低，以中位数查询为例，GPT - 4.1费用比GPT - 4o降低26%，GPT - 4.1 nano是OpenAI迄今成本最低、响应速度最快的模型；重复使用相同上下文时，OpenAI将提示缓存优惠从50%提高至75%，进一步降低整体成本 [4] GPT - 4.1在行业标准评估中的表现 - 编程能力方面，在SWE - bench Verified基准测试中，GPT - 4.1获54.6%的成绩，较GPT - 4o提高21.4个百分点，较GPT - 4.5提高26.6个百分点，成为领先编程模型之一 [4] - 指令执行方面，在Scale's MultiChallenge基准测试中，GPT - 4.1获38.3%的成绩，较GPT - 4o提高10.5个百分点 [4] - 长上下文理解方面，在Video - MME测试的“长文本、无字幕”类别中，GPT - 4.1取得72.0%的成绩，创纪录，较GPT - 4o提高6.7个百分点 [4] GPT - 4.1在小模型和驱动智能体方面的表现 - GPT - 4.1 nano是OpenAI目前速度最快、成本最低的模型，支持100万tokens上下文窗口，MMLU得分80.1%、GPQA得分50.3%、Aider polyglot编程得分9.8%，均高于GPT - 4o mini，适用于分类、自动补全等任务 [4] - GPT - 4.1系列模型在指令执行可靠性及长上下文理解能力方面提升，结合底层能力，开发者可构建实用可靠的智能体系统，应用于软件工程、大规模文档洞察提取等复杂任务，减少人工干预 [4]