OpenAI掀桌子,新模型力压谷歌,o3降到地板价
36氪·2025-06-13 14:07
产品发布 - OpenAI突然发布o3-pro加强版推理大模型 向所有ChatGPT和API的Pro用户开放[1][2] - Plus用户使用限制从每周100次提升至200次[2] - o3-pro在科学 教育 编程 商业和写作等关键领域全面优于o3版本[2] 性能表现 - o3-pro在数学基准测试AIME2024 博士级科学测试GPQA Diamond和编程竞赛中优于o1-pro和o3[6] - 在ARC-AGI-1高难度任务通过率59.3% 但在ARC-AGI-2推理任务通过率仅4.9%[13] - 智力水平以微弱优势领先Gemini 2.5 pro[9] - 支持文本和图像输入 上下文窗口200k 最大输出token数100k[11] 用户体验 - 响应速度明显较慢 简单回复"HI"耗时4分钟 二次测试达13分28秒[15][17] - 更适合处理复杂问题如项目方案 多文件整合等[17] - 在数学逻辑题和编程能力测试中表现优异[19][21] - 需要充足背景信息说明诉求 否则容易过度思考[22] 行业竞争 - OpenAI模型更新频次明显高于2024年 采取更激进淘汰策略[24] - o3-pro输入价格20美元/百万token 输出80美元/百万token 相比o1-pro大幅降价[24] - o3降价80%至输出2美元/百万token 输入8美元/百万token[27] - 价格调整后o3略低于Gemini 2.5 pro 但后者智力水平略高[27]