文章核心观点 OpenAI发布o3和o4 - mini模型,虽有亮点但创新未达预期,公司在行业竞争中逐渐失去优势,GPT - 5表现有待揭晓 [1][4][6] 模型发布情况 - OpenAI预热很久的o3模型完整版和o4 - mini同时发布,此前预告的GPT - 4.1全家桶系列、o3、o4 - mini模型已全部亮相 [1][3] - ChatGPT的Plus、Pro会员以及Team用户即日起可体验o3、o4 - mini和o4 - mini - high,o1、o3 - mini和o3 - mini - high退出 [3] - Sam Altman称o3和o4 - mini可能是GPT - 5发布前最后独立AI推理模型,预计几周内将o3 - pro升级到专业版 [3] 模型亮点 - o3和o4 - mini亮点是可组合调用ChatGPT工具,是OpenAI补足Agent能力探索 [1] - o3作为推理模型,在多个维度基准测试刷新纪录,如视觉任务准确率达87.5%,MathVista达75.4% [1] - o3和o4 - mini将上传图像集中到思维链,实现“用图像思考”能力 [2] - o3在复杂问题上错误率比o1系列低20%,适合生物学、数学和工程领域复杂问题查询 [2] 行业反馈 - 开发者和用户使用时感受到进步,但业内认为创新未达预期 [4] - 此前GPT4.1系列发布后,业内人士认为无特别亮眼突破,对o3期待值不高 [5] - 去年o3亮相时成绩出色,但开发者认为不能代表实际能力 [5] 竞争态势 - 行业进入对数据高要求、Agent全适配时代,OpenAI对开源态度暧昧 [6] - DeepSeek - R1亮相及全方位开源给OpenAI冲击,使其失去竞争优势 [6]
OpenAI并未让DeepSeek惊出一身冷汗