Workflow
终极图灵测试
icon
搜索文档
马斯克将用最强Grok 5,挑战LOL最强战队T1!
搜狐财经· 2025-11-26 21:51
项目核心目标 - 马斯克宣布Grok 5将在2026年挑战由Faker领衔的传奇人类战队T1 [4] - 此次对决被定位为一场关于“感知”与“直觉”的终极图灵测试,旨在验证AI的纯视觉理解和类人推理能力 [5] - 项目的终极目标是将Grok 5的视觉-动作模型应用于特斯拉Optimus人形机器人,以提升其在复杂物理现实世界中的生存和工作能力 [38] 技术路径与核心限制 - 采用纯视觉感知路径,Grok 5仅能通过捕捉屏幕像素(每秒240帧)来理解游戏,而非直接读取游戏底层代码API [12][13] - 施加人类级反应延迟限制(约200毫秒),迫使AI放弃非人手速优势,转而依赖战略预判和逻辑推理 [16][19] - 此技术路径模拟现实世界场景,如自动驾驶汽车需通过视觉识别行人,家庭机器人需判断食物状态,为具身智能奠定基础 [14][15] 模型架构与能力构建 - Grok 5是一款多模态大语言模型,据称将拥有6万亿参数 [22] - 其学习方式从传统强化学习的“试错”转变为“理解”,通过阅读游戏资料和观看数百万小时比赛视频来构建世界模型,具备逻辑推理能力 [23][24][25][26] - 模型可能模拟人类大脑的“快慢系统”,慢系统负责宏观战略规划,快系统处理即时战术操作,以应对毫秒级决策的工程挑战 [27] 选择《英雄联盟》作为测试平台的原因 - 游戏属于不完全信息博弈,存在“战争迷雾”,要求AI具备处理不确定性、进行心理博弈和预测对手意图的能力 [30][32] - 游戏需要五个AI智能体在极短时间内(如0.5秒)达成共识并协同作战,这是对多智能体协作与意图预测能力的极限测试 [33] - 马斯克与《星际争霸2》前职业选手的互动表明,此类复杂即时战略游戏是验证AI战略推理能力的理想平台 [29] 对人类独特能力的挑战 - 对决将测试AI能否应对人类选手(如Faker)基于直觉和创造力的“非理性”决策,这类决策违背AI基于概率训练的常规逻辑 [34][36] - AI需具备识破人类欺骗战术(如假装回城、诱敌深入)的能力,这是在战略层面与人类智慧的直接较量 [36] - 无论胜负,结果都将检验人类独有的“灵光一现”的创造力是否为AI无法逾越的盲区 [40][42]