事件概述 - 2025年12月11日,OpenAI正式推出GPT-5.2系列模型(包括Instant、Thinking、Pro等版本),并向其付费用户群分阶段推送,同时对应模型通过API面向开发者上线 [1] - 该系列被定位为面向“专业知识工作与长流程智能体任务”的新一代主力模型,重点强调了在电子表格处理、演示文稿生成、代码编程、多模态信息理解、长上下文推理及复杂工具调用等方面的性能提升 [1] 核心产品力升级 - 核心升级在于“可交付成果”能力增强:GPT-5.2在评估知识工作产出的GDPval评测中取得了70.9%的胜率或持平率 [2] - 在特定专业任务上表现突出:在“初级投行分析师电子表格建模任务”上,其平均得分较前代模型显著提升9.3个百分点(从59.1%升至68.4%)[2] - 长流程任务与复杂工具调用能力进步:在要求多轮、长序列工具调用的Tau2-bench Telecom任务中达到98.7%的高完成率 [3] - 在真实开发环境评测中表现可靠:在SWE-Bench Pro评测中取得了55.6%的成绩,反映出其在任务拆解、外部工具与环境调用以及最终交付物生成等环节的可靠性显著增强 [3] 技术规格与性能基准 - 核心技术规格:GPT-5.2(API: gpt-5.2)支持文字为主及图像输入,上下文窗口为400,000 tokens,最大输出为128,000 tokens,知识截止日期为2025年8月31日,并具备可调的“reasoning effort”控制 [10] - 多项基准测试领先:在多项基准测试中,GPT-5.2 Thinking版本表现优于前代及主要竞争对手,例如在GPQA科学问题测试中达到92.4%,在AIME 2025竞赛数学测试中达到100.0% [11] 商业化策略 - 采用“订阅稳价、API分层定价”策略:核心并非单纯降价,而是强调按场景分层提效 [4] - API定价梯度显著:gpt-5.2定价为1.75美元/百万输入tokens及14美元/百万输出tokens(缓存输入享有90%折扣),而性能更高的gpt-5.2-pro定价则显著提升至21美元/百万输入与168美元/百万输出 [4] - 订阅端价格保持稳定:ChatGPT端订阅价格保持稳定,并为现有用户提供了为期三个月的GPT-5.1过渡窗口 [4] - 策略目标明确:旨在推动客户进行精细化选型,提升单用户产出与平均收入(ARPU),并为企业在规模化部署时提供更清晰、更具确定性的成本与性能权衡依据 [4] 行业竞争格局 - 是对竞争对手的直接回应:GPT-5.2的推出可视为OpenAI对Google Gemini 3(于2025年11月18日推出)发布周期的直接回应,头部厂商的“迭代速度战”预计将趋于常态化 [5] - 竞争维度发生转变:大模型竞争正从单纯的性能评测,进一步转向“分发入口掌控力、企业系统集成深度与智能体工作流平台化能力”的综合较量 [5] - 对上游产业链的影响:OpenAI的规模化训练与部署高度依赖微软Azure数据中心及NVIDIA GPU(如H100/H200/GB200)集群,在头部厂商持续高强度迭代的驱动下,上游算力与云基础设施景气度有望获得持续支撑 [5] 潜在影响与市场展望 - 深化AI在知识型岗位的渗透:此次迭代方向明确指向了企业付费意愿强烈的核心生产力场景(如财务、投研、咨询、运营与销售支持等),预计将对B端订阅增长、席位扩张与用户使用频率产生积极催化作用 [2] - 推动工作流效率提升:对于金融机构及企业用户而言,将模型嵌入多步骤工作流时,有望降低任务中断与人工返工频率,从而提升流程效率 [3] - 提出新的治理要求:模型能力的深化也对内部权限管控、数据血缘追溯及操作审计等治理环节提出了更为严格的要求 [3]
OpenAI发布GPT-5.2系列:从“问答”迈向“交付”,生产力工具的全面进化
海通国际证券·2025-12-12 23:02