GPT-5.2已上线:差评如潮
创业邦·2025-12-15 08:07
以下文章来源于机器之心 ,作者关注AI的 OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业知识工 作上最强大的模型系列」,在众多基准测试中,GPT-5.2 也都刷新了最新的 SOTA 水平。 | | GPT-5.2 Thinking | GPT-5.1 Thinking | | --- | --- | --- | | GDPval (wins or ties) | 70.9% | 38.8% (GPT-5) | | Knowledge work tasks | | | | SWE-Bench Pro (public) | 55.6% | 50.8% | | Software engineering | | | | SWE-bench Verified | 80.0% | 76.3% | | Software engineering | | | | GPQA Diamond (no tools) | 92.4% | 88.1% | | Science questions | | | | CharXiv Reasoning (w/ Python) | 88.7% | ...