Workflow
OpenAI o3封王,4比0横扫马斯克Grok 4,全球大模型对抗赛完美收官
36氪·2025-08-08 17:29

比赛结果与表现 - OpenAI的o3以4-0的压倒性比分击败xAI的Grok 4,夺得首届Kaggle AI国际象棋表演赛冠军 [1][7][11] - 谷歌的Gemini 2.5 Pro以2.5-1.5战胜OpenAI的o4-mini,获得季军 [3][18] - o3在整个赛事中保持不败,从开赛到夺冠未失一局 [11] - Grok 4在半决赛中以3-2险胜Gemini 2.5 Pro [6] 参赛阵容与规则 - 参赛AI阵容包括OpenAI的o3和o4 mini、xAI的Grok 4、谷歌的Gemini 2.5 Pro和Flash、Anthropic的Claude 4、DeepSeek的R1、Moonshot的Kimi K2 [4] - 比赛规则禁止使用专业象棋引擎,要求AI必须用自然语言下达指令,每步棋有60分钟思考时间 [6] - 连续三次给出无法执行的错误指令将直接判负 [6] 比赛过程分析 - o3展现出系统、稳定的策略,棋路清晰,步步为营 [9] - Grok 4在决赛中频繁失误,包括送子、违背象棋常识的兑子等 [12][14] - o3在第四局中展现惊人韧性,从送皇后到最终逆转胜 [16] - Gemini 2.5 Pro虽然获胜但棋局质量不高,失误不断 [18][19] 行业影响与未来 - 比赛被视为OpenAI与xAI之间的"代理人战争" [1] - 世界棋王Magnus Carlsen评价o3棋力相当于国际等级分1200分,Grok 4约800分 [21][23] - Kaggle计划将AI锦标赛扩展到围棋、狼人杀、模拟经营等更复杂游戏 [25] - 比赛旨在检验大模型的批判性思维、战略规划和临场应变能力 [4]