图像思维

搜索文档
OpenAI发新模型o3和o4-mini!首次实现“图像思维”,可利用所有ChatGPT工具
硬AI· 2025-04-17 23:09
OpenAI发布新款AI模型o3和o4-mini - 公司发布新款AI模型o3和o4-mini,模仿人类推理过程,解决复杂编程和视觉任务 [3][4] - o3模型专注于解决科学、数学和编程相关的复杂多步骤问题,支持图像上传与分析 [4] - o4-mini提供价格、速度和性能之间的平衡,适合开发者选择 [13] 性能表现 - o3和o4-mini在AIME 2024数学竞赛中的准确率分别达91.6%和93.4%,远超o1的74.3% [6] - 在Codeforces编程竞赛中,o3和o4-mini的ELO分数分别为2706和2719,显著领先o1的1891 [6] - o3在博士水平科学问答中的准确率为83.3%,高于o1的78.0% [8] - o3在SWE-bench verified测试中得分为69.1%,o4-mini为68.1%,领先Anthropic的Claude 3.7 Sonnet的62.3% [17] 多模态推理能力 - o3在MMMU视觉问题解决任务中的准确率达82.9%,领先o1的77.6% [11] - 在MathVista视觉数学推理测试中,o3取得86.8%的成绩,远高于o1的71.8% [11] - o3在CharXiv科学图表推理测试中的准确率为78.6%,大幅领先o1的55.1% [11] 开源与市场竞争 - 公司推出开源AI代理CodeX CLI,帮助用户完成编程任务,提升市场竞争力 [3][21] - 面临来自DeepSeek、Anthropic和xAI等公司的竞争压力,编程成为关键竞争领域 [21] - 计划未来几个月内发布开源版本的推理模型,回应DeepSeek开源系统R1的市场影响 [21] 未来计划 - 未来几周将推出o3-pro升级版本,仅向ChatGPT Pro订阅用户开放 [21] - o3和o4-mini可能是GPT-5发布前的最后一批独立推理模型,GPT-5将融合传统与推理模型 [21]