Workflow
《Video Chess》
icon
搜索文档
LLM 翻车现场,ChatGPT 挑战 1979《Video Chess》惨败:连车马象都认错
36氪· 2025-06-17 17:12
话题1:AI模型在棋类游戏中的表现 - ChatGPT在与Atari 2600的象棋对局中输给了48年前、频率1.19 MHz的8位主机[2] - ChatGPT在90分钟的对局中频繁犯错,包括认错棋子、错失双兵叉、记不住被吃掉的棋子等[4] - ChatGPT最终主动认输,表现出在棋类游戏中的明显短板[4] 话题2:语言模型的技术局限性 - ChatGPT作为语言模型,通过分析文本学习词语相关性,基于概率决定输出,不适合棋类游戏的离散系统[5] - 语言模型缺乏"内部记忆"追踪棋盘状态,容易在多个回合后混淆上下文[5] - 语言模型没有专门为棋类构建的"状态表达结构",无法像专业象棋引擎那样进行深度搜索[5] 话题3:AI能力的边界与思考 - 语言模型擅长捕捉序列概率,但不擅长高度组合性的任务[7] - 该事件引发对AI是否真正"懂得"某件事的思考,包括在自动驾驶、金融风控等复杂场景中的应用[7] - 事件暴露了当前对"AI能力"的理解可能存在过度包装的问题[7]