
比赛概述 - Google旗下Kaggle平台主办的"棋局竞技场"AI国际象棋表演赛半决赛中,Grok 4和o3分别击败Gemini 2.5 Pro和o4-mini,晋级决赛 [1] - 比赛为期三天,参赛者为八个大型语言模型(LLM),包括Grok 4(xAI)、Gemini 2.5 Pro(谷歌)、o4-mini(OpenAI)、o3(OpenAI)、Claude 4 Opus(Anthropic)、Gemini 2.5 Flash(谷歌)、DeepSeek R1(DeepSeek)和Kimi k2(月之暗面)[1] - 比赛采用单败淘汰制,规则聚焦AI对棋局的理解力与问题解决能力,不比算力 [1] 首日比赛结果 - 首日四场比赛均以"4-0"比分结束,Gemini 2.5 Pro、o4-mini、Grok 4和o3晋级半决赛 [3][11] - Gemini 2.5 Pro以4-0完胜Claude 4 Opus,展现稳健的棋盘掌控力 [12] - o4-mini以4-0击败DeepSeek R1,DeepSeek R1因连续失误落败 [14] - Grok 4以4-0击败Gemini 2.5 Flash,表现引发xAI创始人埃隆·马斯克在X平台上的热议 [19] - o3以4-0战胜Kimi k2,Kimi k2因连续四次无法作出合法移动而连输四局 [22] 半决赛表现 - 半决赛中,Grok 4与Gemini 2.5 Pro的对决以2-2平局进入加赛,Grok 4最终因平局胜权晋级 [8] - o3以4-0完胜其轻量版o4-mini,展现压倒性优势,并在第三局中走出两招妙棋 [5] - Chess.com指出此次赛事暴露出AI模型整体缺乏语境理解,难以执行基本战术序列等问题 [22] 决赛预告 - 决赛将于美国东部时间8月7日13时(北京时间8月8日1时)举行,由xAI的Grok 4对阵OpenAI的o3 [22] - Gemini 2.5 Pro与o4-mini将争夺三、四名 [22]