OpenAI系列追踪Day3：GPTo3学会看图说话，ScalingLaws验证“大算力=大能力”

报告行业投资评级报告未提及行业投资评级相关内容报告的核心观点 - 2025年4月16日OpenAI发布GPTo3和o4 - mini，多项跑分击败Gemini2.5 Pro，GPT - o3在强化学习中践行Scaling Law，验证“大算力带来大能力” [2][8] - GPT - o3是目前最强大推理模型，在多维度基准测试刷新SOTA，视觉任务表现出色；o4 - mini是为快速、经济高效推理优化的小模型，在非STEM任务和数据科学领域超前代o3 - mini [3][8] - GPT - o3有视觉深度推理、原生工具使用能力，成本大幅下降，Codex CLI推动AI编程助手本地化落地；OpenAI洽谈约30亿美元收购AI编程工具公司Windsurf [4][5][12] - 大规模强化学习呈现“更大计算量 = 更好性能”趋势，GPT - o3践行Scaling Law提升多维度能力，未来模型训练对高算力依赖将长期维持，AI基础设施建设投入仍会处较高水平 [5][6][13] 根据相关目录分别进行总结事件 - 2025年4月16日，OpenAI发布GPTo3和o4 - mini，多项跑分击败Gemini2.5 Pro，GPT - o3在强化学习中践行Scaling Law，验证“大算力带来大能力” [2][8] 点评 - GPT - o3是OpenAI目前最强大推理模型，在编程、数学等多维度基准测试刷新SOTA，视觉任务表现出色；o4 - mini是为快速、经济高效推理优化的小模型，在非STEM任务和数据科学领域超前代o3 - mini [3][8] 值得关注的点 - 首次实现视觉深度推理，推理路径接近人类思维，支持图文输入，引入“视觉推理路径”，实现跨模态理解，在手写板书等任务展现类人推理能力 [4][9] - 具备原生工具使用能力，能自动调用浏览器等工具，无需外部插件或用户提示，在复杂任务处理中自治性强，是构建下一代AI Agent平台核心能力 [4][10] - 成本大幅下降，运行效率优于上一代，GPT - o3执行相同任务token消耗更少，运行成本比GPT - o1低；GPT - 4o mini性能接近主流高端模型，API调用成本仅每百万输入tokens 0.15美元 [4][11] - Codex CLI推动AI编程助手本地化落地，OpenAI开源由GPT - o3与GPT - 4o mini驱动的本地编程智能体Codex CLI；OpenAI洽谈约30亿美元收购AI编程工具公司Windsurf，若达成将标志其在AI驱动开发者工具市场迈出重要一步 [5][12] Scaling Law验证 - 大规模强化学习呈现与预训练阶段一致趋势“更大计算量 = 更好性能”，GPT - o3践行Scaling Law在多维度显著提升，印证模型性能随思考时间和训练资源投入持续提升假设 [5][13] - 这强化对新兴模型判断，训练效率提升不意味着总算力投入减少，反而推动需求上升，未来模型训练对高算力依赖预计长期维持，AI基础设施建设投入仍会较高 [6][14]