GPT-5.2 降智遭全网差评!奥特曼慌了
转自:新智元报道 【导读】 年终AI大戏,OpenAI败给了谷歌?GPT-5.2上线48小时,全网吐槽一大片。第三方数 据实证,Gemini 3 Pro才是真正的王者。 OpenAI打出了GPT-5.2这张「年度王牌」,却没有打赢谷歌... Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分152,仅次于Gemini 3 Pro。 在多项基准测试中,GPT-5.2的实力 并没有「全线霸榜」 。 在由陶哲轩联手百位数学家出的考题——FrontierMath中,GPT-5.2仅在T1-3级中霸榜,T4还是 Gemini 3的高地。 另外,在国际象棋Chess Puzzles中,GPT-5.2拿下了第一的成绩。 不仅如此,多个第三方基准评测显示,GPT-5.2远不及预期,没有打败Gemini 3。 左右滑动查看 唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味着迭代后的可信度更差 了。 包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之 后。 | Model | Global ...