光学错觉
搜索文档
新型「验证码」诞生?这张图让 ChatGPT、Claude、Gemini 都翻了车
36氪· 2025-10-27 18:21
光学错觉作为AI检测器的概念 - 一种基于网格的光学错觉图片,其中心形图案需通过退后观察或眯眼才能被人类视觉系统感知 [1] - 该概念认为人类大脑的生物特性与AI的计算特性存在显著差异,因此可作为一种“AI检测器” [2] - 这种现象源于人类视觉系统的侧抑制机制,会在网格交叉点产生虚幻的暗色斑点或形状感知 [3] 主要AI模型在测试中的表现 - 测试在社交媒体引发广泛关注,获得近50万浏览量,网友对多款主流大模型进行了测试 [5] - GPT-5 Pro、GPT-5和Claude Opus 4.1在初始测试中均未能正确识别隐藏的心形图案 [5][6] - 谷歌Gemini在被直接询问是否看到心形时,给出了否定的回答 [8] - Grok模型在测试中要么无法识别图案,要么错误地识别出单词“JESUS” [9][10] 影响AI识别结果的关键因素 - 提示词的有效性对结果有显著影响,有用户在直接提示“Find the hidden shape”后,GPT-5 Pro给出了正确答案 [12] - 要求模型“看完整个图片”或先让图像模糊化(模拟眯眼效果)等特定指令,能帮助ChatGPT和Claude等模型最终识别出心形 [17][19] - 有测试通过录屏证实,GPT-5 Pro在思考近4分钟后能正确识别出熊猫图片,表明其识别能力与思考时间和具体任务相关 [15] 关于测试有效性与潜在应用的讨论 - 有观点质疑该测试的有效性,认为其并非严谨的基准测试,而是社交媒体上的随机想法 [21] - 类似的动态视觉测试(如暂停后字母或宝剑消失的视频)也被用于考验AI模型(如Gemini),并引发了关于其作为新型验证码以检测机器人的讨论 [22][23]
新型「验证码」诞生?这张图让 ChatGPT、Claude、Gemini 都翻了车
机器之心· 2025-10-27 16:44
文章核心观点 - 一种基于网格的光学错觉现象被用作区分人类视觉系统与人工智能图像识别能力的测试工具 [2][4] - 该测试在社交媒体上获得近50万浏览量,引发大量用户对不同主流大模型进行测试,结果显示多数AI模型在无提示情况下识别失败 [4][6] - 部分AI模型在获得特定提示词或指令后能够正确识别出隐藏形状,表明提示工程对AI性能有关键影响 [14][19] 光学错觉原理与AI测试背景 - 测试图案是一种典型的网格光学错觉,类似于赫尔曼网格错觉,其原理源于人类视觉系统的侧抑制机制 [4] - 人类大脑因生物特性容易受错觉影响而产生虚幻感知,而AI依赖计算和算法,这种差异使其成为有效的“AI检测器” [4] 主流AI模型测试表现 - GPT-5 Pro在无提示情况下思考10多分钟后错误识别为倾斜的方形(菱形),GPT-5错误识别为熊猫,Claude Opus 4.1直接表示未发现隐藏图像 [6][7] - 谷歌Gemini在被直接询问是否看到心形时干脆回复“没有” [9] - Grok模型在测试中要么识别失败,要么错误识别为单词“JESUS” [10][12] 成功识别案例与关键因素 - 有用户通过直接上传图片并输入“Find the hidden shape”提示词,使GPT-5 Pro成功识别出心形 [14] - 通过要求AI模型观察整个图片而非聚焦局部元素,或指示其“模糊图像”模拟人眼眯眼动作,可显著提高识别准确率 [19][21] - 有录屏证据表明GPT-5 Pro的成功识别未依赖网络搜索功能 [17] 其他相关视觉测试案例 - 存在类似动态视觉测试,如晃动字母“tldraw”的视频在暂停时字母消失,以及左右移动的宝剑视频在暂停时消失 [24][25] - 在这些动态测试中,谷歌Gemini模型也出现识别失败的情况 [26]