目前,全世界最常见的验证码服务就是谷歌的CAPTCHA系统(Completely Automated Public Turing test to tell Computersand Humans Apart,即全自动区分计算机和人类的公开图灵测试)。其工作原理与国内常见的验证码系统差不多,给你一个图片,让你找出其中的某种图片或识别其中的数字和字幕。
数字型CAPTCHA
识别图片型CAPTCHA“找出其中的冰激凌”
谷歌已经对其验证码系统进行了多年的开发。之前最新的CAPTCHA系统只需要用户在一个选择框中打钩:“I’m not a robot”(我不是机器人),其系统背后的算法就可以计算出用户是不是人类。
但是,最近谷歌又进了一步,开发出了一种全新的“隐身”验证码系统。该系统在表面没有任何识别图像,文字,甚至打钩的要求。它可以直接通过分析后台数据判断用户是不是人类。不过,谷歌没有透露其算法的逻辑。毕竟,如果做自动软件的人知道盾是怎么做出来的,他们就能轻易做出针对它的矛了。
其实,在验证用户是不是人之外,谷歌的验证码系统还为其数个服务提供了不少福利。当谷歌的系统发现一个难以解决的问题时,这个问题往往会变成一个验证码,让人类来解决。
就拿谷歌数字化书籍的项目来说,当谷歌光学字符识别(OCR - Optical Character Recognition)发现一个难以识别的单词时,它就会把它截图成为一个验证码,让用户告诉它这个单词是什么。数字验证码(比如图一右侧的8001)往往是谷歌地图街景系统难以识别的街牌号。而“选择图中的冰激凌”则是为谷歌的机器学习算法提供数据,用来训练人工智能。“狡诈”的谷歌把全球的网民都变成了他的员工。
不过,这将会成为过去式了。在隐身验证码大规模推广后,只有可疑的用户才会看到验证码进行验证。所以在不久的将来,当你突然发现需要各种验证码时,你最好对你的电脑杀个毒。因为这是谷歌在提醒你:“你的后台数据很可疑。”