马斯克开始疯狂剧透Grok 5了
搜狐财经·2025-09-18 14:34
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 马斯克的Grok 5偷偷藏不住了。 刚刚ARC-AGI榜单官宣出现新SOTA,用的还是Grok 4+程序合成技术微调。 好小汁,啥时候开始Grok都弯道超车了?OpenAI、Anthropic、谷歌一众明星模型都被压一头。 一石激起千层浪,网友纷纷发问,那等Grok5出来,岂不是…… 马斯克也随即出来回应: 我现在认为Grok 5能达到AGI。 顺便附赠了一堆有关Grok 5的爆料。 马斯克疯狂剧透Grok 5 这事还得从Grok 4超越预期的表现说起,发布才两个月就登上多个榜单第一的宝座,而就在刚刚,ARC Prize发布了两个最新的ARC-AGI榜单SOTA方 案: 先简单介绍一下ARC-AGI排行榜,其旨在评估AI解决复杂难题的能力,类似于人类的智力测试,从而反映LLM的推理能力。 测试任务包含v1和v2版本,v2需要LLM完成更多的多步骤推理,一般来说,即使是最优秀的LLM也只能在v2中获得16%的准确率。 都是开源的。 都使用的是Grok 4作为基础模型。 都实现了带测试自适应的程序合成外循环。 GPT-5在二者上的得分依次是65.7%和9.9% ...