新型「验证码」诞生?这张图让 ChatGPT、Claude、Gemini 都翻了车
机器之心·2025-10-27 16:44

文章核心观点 - 一种基于网格的光学错觉现象被用作区分人类视觉系统与人工智能图像识别能力的测试工具 [2][4] - 该测试在社交媒体上获得近50万浏览量,引发大量用户对不同主流大模型进行测试,结果显示多数AI模型在无提示情况下识别失败 [4][6] - 部分AI模型在获得特定提示词或指令后能够正确识别出隐藏形状,表明提示工程对AI性能有关键影响 [14][19] 光学错觉原理与AI测试背景 - 测试图案是一种典型的网格光学错觉,类似于赫尔曼网格错觉,其原理源于人类视觉系统的侧抑制机制 [4] - 人类大脑因生物特性容易受错觉影响而产生虚幻感知,而AI依赖计算和算法,这种差异使其成为有效的“AI检测器” [4] 主流AI模型测试表现 - GPT-5 Pro在无提示情况下思考10多分钟后错误识别为倾斜的方形(菱形),GPT-5错误识别为熊猫,Claude Opus 4.1直接表示未发现隐藏图像 [6][7] - 谷歌Gemini在被直接询问是否看到心形时干脆回复“没有” [9] - Grok模型在测试中要么识别失败,要么错误识别为单词“JESUS” [10][12] 成功识别案例与关键因素 - 有用户通过直接上传图片并输入“Find the hidden shape”提示词,使GPT-5 Pro成功识别出心形 [14] - 通过要求AI模型观察整个图片而非聚焦局部元素,或指示其“模糊图像”模拟人眼眯眼动作,可显著提高识别准确率 [19][21] - 有录屏证据表明GPT-5 Pro的成功识别未依赖网络搜索功能 [17] 其他相关视觉测试案例 - 存在类似动态视觉测试,如晃动字母“tldraw”的视频在暂停时字母消失,以及左右移动的宝剑视频在暂停时消失 [24][25] - 在这些动态测试中,谷歌Gemini模型也出现识别失败的情况 [26]