Grok 4遥遥领先,但马斯克想要得更多
首席商业评论·2025-07-21 11:34
这是一场停不下来的豪赌。 Grok4真的很强 近期马斯克发布了"世界上最强的AI模型",有人直言道AGI在这里已经实现了。xAI 发布了两个版本,分别 是 Grok 4 和 Grok 4 Heavy。两者都是推理模型,前者是单代理版本,Grok-4 Heavy 则是多代理版本,支持 四个代理同时工作。 "Grok 4 是在所有学科里都达到研究生水平的,甚至比大多数 PhD 都强。"直播晚点 1 小时后,马斯克首先 给 Grok 最新一代的水平如此定位。 除了在 SAT、GRE 考试中取得近乎完美的成绩,在「人类终极考试(HLE)」测试里,Grok 4 现在的得分 比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版本更是突破了 40%。相比Kimi(以中文处理见长),Grok4 的多语言支持更全面,尤其在英语和编码混合任务中领先。Kimi虽快,但Grok4的深度思考能力让它在科研 场景中更可靠。 在编码与软件工程方面: SWE-Bench基准:Grok4约60%以上,高于GPT-4.5的54.6%、Gemini 2.5 Pro的类似 分数。Claude 4虽达72.7%,但Grok4在代 ...