Seek .-首届大模型象棋争霸赛：Grok 4与o3挺进决赛，DeepSeek、Kimi落败

比赛概述 - Google旗下Kaggle平台主办的"棋局竞技场"AI国际象棋表演赛半决赛中，Grok 4和o3分别击败Gemini 2.5 Pro和o4-mini，晋级决赛 [1] - 比赛为期三天，参赛者为八个大型语言模型（LLM），包括Grok 4（xAI）、Gemini 2.5 Pro（谷歌）、o4-mini（OpenAI）、o3（OpenAI）、Claude 4 Opus（Anthropic）、Gemini 2.5 Flash（谷歌）、DeepSeek R1（DeepSeek）和Kimi k2（月之暗面）[1] - 比赛采用单败淘汰制，规则聚焦AI对棋局的理解力与问题解决能力，不比算力 [1] 首日比赛结果 - 首日四场比赛均以"4-0"比分结束，Gemini 2.5 Pro、o4-mini、Grok 4和o3晋级半决赛 [3][11] - Gemini 2.5 Pro以4-0完胜Claude 4 Opus，展现稳健的棋盘掌控力 [12] - o4-mini以4-0击败DeepSeek R1，DeepSeek R1因连续失误落败 [14] - Grok 4以4-0击败Gemini 2.5 Flash，表现引发xAI创始人埃隆·马斯克在X平台上的热议 [19] - o3以4-0战胜Kimi k2，Kimi k2因连续四次无法作出合法移动而连输四局 [22] 半决赛表现 - 半决赛中，Grok 4与Gemini 2.5 Pro的对决以2-2平局进入加赛，Grok 4最终因平局胜权晋级 [8] - o3以4-0完胜其轻量版o4-mini，展现压倒性优势，并在第三局中走出两招妙棋 [5] - Chess.com指出此次赛事暴露出AI模型整体缺乏语境理解，难以执行基本战术序列等问题 [22] 决赛预告 - 决赛将于美国东部时间8月7日13时（北京时间8月8日1时）举行，由xAI的Grok 4对阵OpenAI的o3 [22] - Gemini 2.5 Pro与o4-mini将争夺三、四名 [22]