Workflow
Gemini新版蝉联竞技场榜一,但刚发布就被越狱了
量子位·2025-06-06 08:58

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌CEO劈柴哥还发了一张AI合成的狮子照片,配文一个"Gemini",暗示了新模型的实力。 没等来o3 Pro和GPT-5,隔壁谷歌的Gemini先更新了。 深夜,谷歌通过等多个账号同时官宣, Gemini 2.5 Pro再次推出新版本 (0605)。 新版本在代码、推理等任务上的表现更上一层楼, 在超难数据集"人类最后的考试"中以21.6%的成绩超过了o3 。 在大模型竞技场上,新版Gemini也超越了自己, Elo评分比上个月的版本提升了24分 。 | ഗ്ര Text | | | 1 7 hours ago | | --- | --- | --- | --- | | Rank (UB) ↑ | Model ↑↓ | Score 1J | Votes 1↓ | | 1 | G gemini-2.5-pro-preview-06-05 | 1470 | 4,701 | | 2 | G gemini-2.5-pro-preview-05-06 | 1446 | 10,386 | | 2 | இ o3-2025-04-16 | 1443 | 13,808 ...