OpenAI发布GPT-4.1,价格更低背景下全面超越GPT-4o
海通国际证券·2025-04-18 15:40

报告行业投资评级 - 维持计算机板块“增持”评级 [4] 报告的核心观点 - GPT - 4.1系列模型发布凸显AI业界“性能提升同时降低成本”趋势,将吸引开发者接入OpenAI的API,推动AI应用开发和业务拓展,提升OpenAI市场竞争力,为产业链带来投资机会,刺激科技股市场活跃度,推动人工智能板块估值提升 [4] 根据相关目录分别进行总结 GPT - 4.1系列模型发布情况 - 4月15日,OpenAI在API中推出GPT - 4.1、GPT - 4.1 mini和GPT - 4.1 nano三款新模型,各方面均优于GPT - 4o和GPT - 4o mini,支持最大100万个tokens的上下文窗口,长上下文理解能力更强 [4] GPT - 4.1系列模型成本优势 - 通过优化推理系统,GPT - 4.1系列使用成本降低,以中位数查询为例,GPT - 4.1费用比GPT - 4o降低26%,GPT - 4.1 nano是OpenAI迄今成本最低、响应速度最快的模型;重复使用相同上下文时,OpenAI将提示缓存优惠从50%提高至75%,进一步降低整体成本 [4] GPT - 4.1在行业标准评估中的表现 - 编程能力方面,在SWE - bench Verified基准测试中,GPT - 4.1获54.6%的成绩,较GPT - 4o提高21.4个百分点,较GPT - 4.5提高26.6个百分点,成为领先编程模型之一 [4] - 指令执行方面,在Scale's MultiChallenge基准测试中,GPT - 4.1获38.3%的成绩,较GPT - 4o提高10.5个百分点 [4] - 长上下文理解方面,在Video - MME测试的“长文本、无字幕”类别中,GPT - 4.1取得72.0%的成绩,创纪录,较GPT - 4o提高6.7个百分点 [4] GPT - 4.1在小模型和驱动智能体方面的表现 - GPT - 4.1 nano是OpenAI目前速度最快、成本最低的模型,支持100万tokens上下文窗口,MMLU得分80.1%、GPQA得分50.3%、Aider polyglot编程得分9.8%,均高于GPT - 4o mini,适用于分类、自动补全等任务 [4] - GPT - 4.1系列模型在指令执行可靠性及长上下文理解能力方面提升,结合底层能力,开发者可构建实用可靠的智能体系统,应用于软件工程、大规模文档洞察提取等复杂任务,减少人工干预 [4]

OpenAI发布GPT-4.1,价格更低背景下全面超越GPT-4o - Reportify