Workflow
reCAPTCHA
icon
搜索文档
你以为在点「红绿灯」验证身份,其实是在给AI免费打工
36氪· 2025-11-13 07:46
如果这是下一代图形验证码,你怎么看? 感觉会经历无数遍「您对 CAPTCHA 的响应似乎无效。请在下方重新验证您不是机器人」,不知道猫主子们怎么想。 这是最近很火的一篇调侃「我不是机器人」验证流程的帖子。视频里显示,用户得用鼠标一个个点选那些灰色的「猫屎团」,拖到旁边的垃圾桶里,最后 过关后,得勾选「我不是猫」。 这个帖子的互动量爆炸,浏览量达到了一百多万。 评论区里非常热闹,有人觉得这比识别界限模糊的红绿灯像素好多了。 也有人联想到美剧《人生切割术》里的数据精炼工作。 还有人开玩笑:「所以只有猫主子才是真正的人类。」 其中一个讨论热度很高:「图像验证是在帮 AI 训练数据,还免费。」 帮 AI 训练数据?这就要展开说说了。 众所周知,不管是注册账号还是发帖,验证码都是个必不可少的东西。它的「大名」叫 CAPTCHA,全称是「全自动区分计算机和人类的图灵测试」。它 的作用,顾名思义就是区分人和机器人,避免机器人刷屏、刷票或搞破坏。 最早,其主要形式是扭曲的文字或图片。扭曲的程度,决定了它难不难被认出来。 于是,一个「一箭双雕」的天才想法诞生了,它叫reCAPTCHA。 这套系统从 v1 开始,就不是一个单纯的 ...
你以为在点「红绿灯」验证身份,其实是在给AI免费打工
机器之心· 2025-11-12 21:23
验证码的演变与核心功能 - 验证码(CAPTCHA)的核心功能是执行全自动区分计算机和人类的图灵测试,用于防止机器人刷屏、刷票或搞破坏 [9] - 其最早形式是扭曲的文字或图片,通过扭曲程度来增加识别难度 [9] reCAPTCHA v1:大型人力众包项目 - reCAPTCHA v1 的设计者发现全球网民每天花费数百万小时输入验证码,遂将其转化为一个大型人力众包项目 [10][12] - 系统每次向用户展示两个扭曲单词,其中一个为已知答案的“控制词”,另一个是来自古籍报纸等AI难以识别的“未知词”,用户在对两个词进行正确输入的同时,无偿帮助谷歌完成了海量古籍的数字化转录工作 [13][14] AI技术进步对验证码的冲击 - 谷歌自身AI在2014年破解最难的扭曲文本验证码准确率已达99.8%,这背后是卷积神经网络(CNN)的功劳,导致reCAPTCHA v1在技术上彻底失效 [15] - 学术研究证实,AI模型破解文本验证码的准确率普遍达到98%甚至100% [15] reCAPTCHA v2:为AI训练提供免费数据 - 为应对v1失效,reCAPTCHA v2推出图像验证,要求用户识别“汽车”、“交通信号灯”等内容 [16][19] - 此阶段恰逢谷歌大力发展自动驾驶项目Waymo,全球数十亿网民在完成验证码的过程中,无偿为谷歌的自动驾驶AI提供了识别关键物体的训练数据 [19] - 有学者估算,人类为此贡献的无偿劳动总价值超过61亿美元 [20] reCAPTCHA v3:行为生物识别与隐私争议 - 2024年研究显示,AI破解v2图像挑战的准确率已达100%,验证码防线转向reCAPTCHA v3 [21][23][24] - v3的核心是“行为生物识别”,它完全隐形,通过分析用户的鼠标轨迹、点击位置、浏览器指纹及谷歌Cookie等隐私数据,为用户生成0.0(机器人)到1.0(人类)的可信度分数 [24][25][27] - 此模式引发隐私噩梦,用户越使用VPN、隐私浏览器等保护隐私,系统越可能判定其为机器人,形成隐私悖论 [28] 未来验证码的发展方向 - 研究人员提出“对抗性CAPTCHA”方案,利用AI容易被“对抗性样本”(对人类无意义的噪音图像)欺骗的弱点来区分人机 [26][30] - 未来验证码可能不再是测试解决人类问题的能力,而是测试是否会犯AI才会犯的错误 [31]
AI可以破解AI生成的验证码吗?
36氪· 2025-04-29 16:26
验证码的起源与演变 - 验证码最初设计目的是区分人类用户和电脑,全称为CAPTCHA(全自动区分计算机和人类的图灵测试),由路易斯·冯·安发明[8] - 早期验证码采用简单扭曲字符,随着OCR技术进步,逐渐升级为复杂字符变形、干扰线、颜色变化以及图像/音频验证码[9] - 互联网初期自动化程序泛滥(垃圾邮件、恶意灌水等)催生验证码需求,以维护网络秩序并减少服务器资源消耗[6] AI与验证码的攻防对抗 - 现代图形验证码利用AI算法动态生成挑战性图像(如区分特定角色),部分采用生成对抗网络(GANs)制造对抗样本[11] - AI破解技术同步升级:卷积神经网络(CNNs)可识别复杂图像特征,深度学习模型能理解验证码上下文信息[13] - 行为验证码(如reCAPTCHA v2/v3)通过分析鼠标轨迹、点击节奏等行为特征判断用户真实性,v3版本完全后台运行并输出风险评分[16][17] AI绕过验证码的高级策略 - 模拟人类行为:贝塞尔曲线生成自然鼠标轨迹,模拟打字停顿/回删,精准控制表单填写节奏[22][23] - 身份隐藏技术:使用住宅代理IP分布式请求,自动切换网络节点规避封锁,分析网页结构规避蜜罐陷阱[25][27][28] - 突破频率限制:分布式爬虫框架分批次请求数据,智能调度避免触发反自动化机制[30] 生物识别技术的安全挑战 - AI可修复模糊指纹图像并3D打印假指纹,2014年已有成功解锁iPhone案例[35] - GAN生成的"万能指纹"(Master Prints)在低端设备破解成功率超20%,高端设备因活体检测仍安全[36][38] - "万能面容"(Master Faces)对简单算法系统攻击成功率超40%,Deepfake和3D面具构成新威胁[40] 验证技术未来发展趋势 - 安全设计转向智能身份验证:通过设备信誉、行为特征等非干扰方式判断用户真实性[46] - 技术成本下降加剧风险:AI破解成本每年降低10倍,使普通用户也可能成为攻击目标[40] - 行业需平衡安全与体验:过度复杂的验证码主要影响人类用户,而非自动化脚本[43]