自动驾驶(Waymo)
搜索文档
你以为在点「红绿灯」验证身份,其实是在给AI免费打工
36氪· 2025-11-13 07:46
如果这是下一代图形验证码,你怎么看? 感觉会经历无数遍「您对 CAPTCHA 的响应似乎无效。请在下方重新验证您不是机器人」,不知道猫主子们怎么想。 这是最近很火的一篇调侃「我不是机器人」验证流程的帖子。视频里显示,用户得用鼠标一个个点选那些灰色的「猫屎团」,拖到旁边的垃圾桶里,最后 过关后,得勾选「我不是猫」。 这个帖子的互动量爆炸,浏览量达到了一百多万。 评论区里非常热闹,有人觉得这比识别界限模糊的红绿灯像素好多了。 也有人联想到美剧《人生切割术》里的数据精炼工作。 还有人开玩笑:「所以只有猫主子才是真正的人类。」 其中一个讨论热度很高:「图像验证是在帮 AI 训练数据,还免费。」 帮 AI 训练数据?这就要展开说说了。 众所周知,不管是注册账号还是发帖,验证码都是个必不可少的东西。它的「大名」叫 CAPTCHA,全称是「全自动区分计算机和人类的图灵测试」。它 的作用,顾名思义就是区分人和机器人,避免机器人刷屏、刷票或搞破坏。 最早,其主要形式是扭曲的文字或图片。扭曲的程度,决定了它难不难被认出来。 于是,一个「一箭双雕」的天才想法诞生了,它叫reCAPTCHA。 这套系统从 v1 开始,就不是一个单纯的 ...
你以为在点「红绿灯」验证身份,其实是在给AI免费打工
机器之心· 2025-11-12 21:23
验证码的演变与核心功能 - 验证码(CAPTCHA)的核心功能是执行全自动区分计算机和人类的图灵测试,用于防止机器人刷屏、刷票或搞破坏 [9] - 其最早形式是扭曲的文字或图片,通过扭曲程度来增加识别难度 [9] reCAPTCHA v1:大型人力众包项目 - reCAPTCHA v1 的设计者发现全球网民每天花费数百万小时输入验证码,遂将其转化为一个大型人力众包项目 [10][12] - 系统每次向用户展示两个扭曲单词,其中一个为已知答案的“控制词”,另一个是来自古籍报纸等AI难以识别的“未知词”,用户在对两个词进行正确输入的同时,无偿帮助谷歌完成了海量古籍的数字化转录工作 [13][14] AI技术进步对验证码的冲击 - 谷歌自身AI在2014年破解最难的扭曲文本验证码准确率已达99.8%,这背后是卷积神经网络(CNN)的功劳,导致reCAPTCHA v1在技术上彻底失效 [15] - 学术研究证实,AI模型破解文本验证码的准确率普遍达到98%甚至100% [15] reCAPTCHA v2:为AI训练提供免费数据 - 为应对v1失效,reCAPTCHA v2推出图像验证,要求用户识别“汽车”、“交通信号灯”等内容 [16][19] - 此阶段恰逢谷歌大力发展自动驾驶项目Waymo,全球数十亿网民在完成验证码的过程中,无偿为谷歌的自动驾驶AI提供了识别关键物体的训练数据 [19] - 有学者估算,人类为此贡献的无偿劳动总价值超过61亿美元 [20] reCAPTCHA v3:行为生物识别与隐私争议 - 2024年研究显示,AI破解v2图像挑战的准确率已达100%,验证码防线转向reCAPTCHA v3 [21][23][24] - v3的核心是“行为生物识别”,它完全隐形,通过分析用户的鼠标轨迹、点击位置、浏览器指纹及谷歌Cookie等隐私数据,为用户生成0.0(机器人)到1.0(人类)的可信度分数 [24][25][27] - 此模式引发隐私噩梦,用户越使用VPN、隐私浏览器等保护隐私,系统越可能判定其为机器人,形成隐私悖论 [28] 未来验证码的发展方向 - 研究人员提出“对抗性CAPTCHA”方案,利用AI容易被“对抗性样本”(对人类无意义的噪音图像)欺骗的弱点来区分人机 [26][30] - 未来验证码可能不再是测试解决人类问题的能力,而是测试是否会犯AI才会犯的错误 [31]