Workflow
奥特曼自诩:达到或接近天才水平!OpenAI,重磅发布!
证券时报·2025-04-17 12:31

模型发布概述 - OpenAI发布两款o系列推理模型o3和o4-mini,是o系列中首次可以使用图像进行思维链推理、实现“看图思考”的模型 [1] - o3是公司最强大的推理旗舰模型,在编程、数学、科学、视觉感知等多个维度基准测试中处于领先位置 [1] - o4-mini是针对快速高效、成本效益推理优化的较小模型,更具性价比 [1] 模型性能与能力 - o3和o4-mini经过训练可在做出反应前进行更长时间的思考,是公司迄今为止发布的最智能模型,代表ChatGPT能力的一次重大飞跃 [6] - 在STEM问答、图表阅读和推理、感知原语和视觉搜索方面均达到新的最先进性能 [8] - 在外部专家评估中,o3在困难的现实任务中比OpenAI o1犯的重大错误少20%,在编程、商业/咨询和创意构思等领域表现出色 [8] - o4-mini以其尺寸和成本实现卓越性能,是AIME2024和2025基准测试中表现最佳模型,支持比o3高得多的使用限制,具备高容量、高吞吐量优势 [8] 图像推理与工具调用 - o3和o4-mini可以直接将图像整合到思维链中,用图像进行思考,在多模态基准测试中展现顶尖性能 [10] - 模型可解读白板照片、教科书图表或手绘草图,即使图像模糊、反转或质量低下也能进行解读,并可动态操作图像进行旋转、缩放或变换 [10] - 模型可完全访问ChatGPT中的工具,以及通过API函数调用访问用户自定义工具,能够将多个工具调用串联起来自主执行任务 [13] 公司产品策略与路线图 - 公司在新模型发布上保持密集节奏,在推出o3系列前一天还推出三款GPT-4.1系列模型,包含标准版GPT-4.1、轻量款GPT-4.1mini及超小型版本GPT-4.1nano [15] - GPT-4.1系列是面对全球大模型厂商激烈价格竞争采取的策略,以更具性价比版本吸引用户,其最大优势在于多模态处理、代码能力、指令遵循和成本方面显著提升 [15] - GPT-4.1比GPT-4o价格降低26%,GPT-4.1Nano作为最小最快模型,每百万token成本仅为12美分 [15] - 公司预计在未来几周内将o3升级到专业版o3-pro [4] - GPT-5发布时间延迟,项目已开发超过18个月,成本花费巨大却未取得预期成果,因计算能力限制和整合困难无法按预期频率推出 [16] - 公司计划在未来几个月发布GPT-5,并预期发布后会非常受欢迎,需要提前做好准备 [16]