奥特曼自诩：达到或接近天才水平！OpenAI，重磅发布！

模型发布概述 - OpenAI发布两款o系列推理模型o3和o4-mini，是o系列中首次可以使用图像进行思维链推理、实现“看图思考”的模型 [1] - o3是公司最强大的推理旗舰模型，在编程、数学、科学、视觉感知等多个维度基准测试中处于领先位置 [1] - o4-mini是针对快速高效、成本效益推理优化的较小模型，更具性价比 [1] 模型性能与能力 - o3和o4-mini经过训练可在做出反应前进行更长时间的思考，是公司迄今为止发布的最智能模型，代表ChatGPT能力的一次重大飞跃 [6] - 在STEM问答、图表阅读和推理、感知原语和视觉搜索方面均达到新的最先进性能 [8] - 在外部专家评估中，o3在困难的现实任务中比OpenAI o1犯的重大错误少20%，在编程、商业/咨询和创意构思等领域表现出色 [8] - o4-mini以其尺寸和成本实现卓越性能，是AIME2024和2025基准测试中表现最佳模型，支持比o3高得多的使用限制，具备高容量、高吞吐量优势 [8] 图像推理与工具调用 - o3和o4-mini可以直接将图像整合到思维链中，用图像进行思考，在多模态基准测试中展现顶尖性能 [10] - 模型可解读白板照片、教科书图表或手绘草图，即使图像模糊、反转或质量低下也能进行解读，并可动态操作图像进行旋转、缩放或变换 [10] - 模型可完全访问ChatGPT中的工具，以及通过API函数调用访问用户自定义工具，能够将多个工具调用串联起来自主执行任务 [13] 公司产品策略与路线图 - 公司在新模型发布上保持密集节奏，在推出o3系列前一天还推出三款GPT-4.1系列模型，包含标准版GPT-4.1、轻量款GPT-4.1mini及超小型版本GPT-4.1nano [15] - GPT-4.1系列是面对全球大模型厂商激烈价格竞争采取的策略，以更具性价比版本吸引用户，其最大优势在于多模态处理、代码能力、指令遵循和成本方面显著提升 [15] - GPT-4.1比GPT-4o价格降低26%，GPT-4.1Nano作为最小最快模型，每百万token成本仅为12美分 [15] - 公司预计在未来几周内将o3升级到专业版o3-pro [4] - GPT-5发布时间延迟，项目已开发超过18个月，成本花费巨大却未取得预期成果，因计算能力限制和整合困难无法按预期频率推出 [16] - 公司计划在未来几个月发布GPT-5，并预期发布后会非常受欢迎，需要提前做好准备 [16]