报告行业投资评级 报告未提及行业投资评级相关内容 报告的核心观点 - 2025年4月16日OpenAI发布GPTo3和o4 - mini,多项跑分击败Gemini2.5 Pro,GPT - o3在强化学习中践行Scaling Law,验证“大算力带来大能力” [2][8] - GPT - o3是目前最强大推理模型,在多维度基准测试刷新SOTA,视觉任务表现出色;o4 - mini是为快速、经济高效推理优化的小模型,在非STEM任务和数据科学领域超前代o3 - mini [3][8] - GPT - o3有视觉深度推理、原生工具使用能力,成本大幅下降,Codex CLI推动AI编程助手本地化落地;OpenAI洽谈约30亿美元收购AI编程工具公司Windsurf [4][5][12] - 大规模强化学习呈现“更大计算量 = 更好性能”趋势,GPT - o3践行Scaling Law提升多维度能力,未来模型训练对高算力依赖将长期维持,AI基础设施建设投入仍会处较高水平 [5][6][13] 根据相关目录分别进行总结 事件 - 2025年4月16日,OpenAI发布GPTo3和o4 - mini,多项跑分击败Gemini2.5 Pro,GPT - o3在强化学习中践行Scaling Law,验证“大算力带来大能力” [2][8] 点评 - GPT - o3是OpenAI目前最强大推理模型,在编程、数学等多维度基准测试刷新SOTA,视觉任务表现出色;o4 - mini是为快速、经济高效推理优化的小模型,在非STEM任务和数据科学领域超前代o3 - mini [3][8] 值得关注的点 - 首次实现视觉深度推理,推理路径接近人类思维,支持图文输入,引入“视觉推理路径”,实现跨模态理解,在手写板书等任务展现类人推理能力 [4][9] - 具备原生工具使用能力,能自动调用浏览器等工具,无需外部插件或用户提示,在复杂任务处理中自治性强,是构建下一代AI Agent平台核心能力 [4][10] - 成本大幅下降,运行效率优于上一代,GPT - o3执行相同任务token消耗更少,运行成本比GPT - o1低;GPT - 4o mini性能接近主流高端模型,API调用成本仅每百万输入tokens 0.15美元 [4][11] - Codex CLI推动AI编程助手本地化落地,OpenAI开源由GPT - o3与GPT - 4o mini驱动的本地编程智能体Codex CLI;OpenAI洽谈约30亿美元收购AI编程工具公司Windsurf,若达成将标志其在AI驱动开发者工具市场迈出重要一步 [5][12] Scaling Law验证 - 大规模强化学习呈现与预训练阶段一致趋势“更大计算量 = 更好性能”,GPT - o3践行Scaling Law在多维度显著提升,印证模型性能随思考时间和训练资源投入持续提升假设 [5][13] - 这强化对新兴模型判断,训练效率提升不意味着总算力投入减少,反而推动需求上升,未来模型训练对高算力依赖预计长期维持,AI基础设施建设投入仍会较高 [6][14]
OpenAI系列追踪Day3:GPTo3学会看图说话,ScalingLaws验证“大算力=大能力”
海通国际证券·2025-04-17 19:04