从此摆脱复杂的验证码,谷歌新技术助你一秒钟轻松登录

和大家朝夕相处的产品君其实也是也是一位爱好旅行的小青年,产品君一直幻想有一天可以去一趟浪漫的欧洲,行走在卢浮宫前,拿出手机即刻一拍,博物馆的历史跃然"屏上";乘坐已有一百多年历史的巴黎地铁,手机一扫,翻译好的车站名立刻呈现;拍摄街景的同时,文字介绍也同时显现~~产品君并没有在做梦,这些旅途中的小科技依靠OCR技术完全可以实现,可尽管OCR技术强大,它还有个多年劲敌,这也是今天产品君想为大家隆重介绍的主角,它不是别人,就是 “验证码”!

“验证码”?!产品君你有木有搞错啊,就是那个被玩坏的12306吗?好吧产品君承认,这个画风确实相差有点大,可是今天产品君正要好好的为“验证码”下名,不要小瞧这验证码,它背后还有好多你不知道的事嘞,尤其是最近的大新闻,谷歌推出新验证码服务(Invisible reCAPTCHA),不用点击即可拦截各种恶意访问,简直强大无敌啊!

要为大家详细介绍谷歌隐形验证码服务这神一般的进阶史,那一定得先从“CAPTCHA”说起,尽管这个单词看着就有点像乱码,它其实是“Completely Automated Public Turing Test to Tell Computers and Humans Apart”的首字母缩写,含义为“全自动区分计算机和人类的图灵测试”。

据说啊,这最早的验证码机制首先是来源于黑客的暗语,他们不想让机器读懂他们的语言,于是将拉丁字母用符号、数字等提到表示出来。比如骂人“shit”(狗屎)就被他们写成“$#!+”。1997年,当时有人通过程序发“链接炸弹”到引擎库中,导致搜索结果被污染,AltaVista的搜索引擎的工程师就开始构思验证码的产品原型。到了2002年,来自卡内基梅隆大学的学生团队更深化了验证码的概念,并起了个名字“reCAPTCHA”,致力于保护人类免受计算机的攻击,这项技术在2009年被google收购。

当时他们的设计是这样的:当传来一个访问请求后,计算机就会随机生成一组数字或符号,然后通过一些随机的规则使其难以辨认,例如使其变色、扭曲,再加上横线、斑点,最终生成一幅图片。他们认为你是人嘛,你肯定认识这些乱七八糟的图案,可是产品君想说,也不是那么好认啊,这都是什么字体呀,真实逼死宝宝了!

现在由产品君为大家介绍下这个reCAPTCHA的工作原理,这也是一项人工智能呀,而且它还有无心插柳柳成荫的神奇功效。

它的原理是这样:

Step1 :我们选择一篇年代比较久远看不太清的文章

Step2 :我们从这篇文章中提取一个不能进行OCR的词,这个词的特点就是不易辨认

Step3: 我们加上一些符号让这个词更不好识别

Step4: 生成两个验证码

软件将能够正确识别CAPTCHA词的用户看作是人类,当CAPTCHA词被正确识别出来后,程序判别,此人为人。然后勒,程序再把另一个难认词添加到数据库中,这样啊也就借助人完成了一次人工OCR识别!

为什么要设计这个环节呢?因为其实当用户在费老大劲识别这些难认字符的同时也为古籍保护作出一点点贡献,毕竟又不是所有文章印到电脑里都是清晰可见的,大家一定有这样的感受,读一篇年代稍微久远的文献,那个费劲呀。举个栗子比如下面这篇文章:

在电脑眼中就是这样的,简直是一片乱码~

而对于那些实在难以辨认的单词,程序会设计多人校验提高正确率。它所取得的巨大成果是:借助广大网民之手,纽约时报从1851年到现在的所有报纸,总共超过1千3百万篇文章都已经成功录入计算机。如果依靠手工输入,人力,资金,时间都将是巨大的,然而借助reCAPTCHA, 以及每天上网的我们,这项工作短时间内就完成啦。( 这不就是咱免费众包的形式嘛,谷歌大大好聪明!)


谷歌还将这项技术充分支持了它伟大的板块—谷歌地图中, Google 让reCAPTCHA 里显示街景的图片。这样就可以从街景里提取如街道名称和交通标志等数据,向 Google 地图里添加商铺地址和位置等有用信息,准确率达90%。我们回到上面那种照片,是不是除了文字还有很多门牌号信息需要识别。

但是总是识别这些难识别的文字和街牌号很无趣,在2014年,谷歌对reCAPTCHA进行了一次大升级,简化了人机识别的流程同时也大大提高了准确性,基本上也是我们现在打开Youtube使用的识别机制~

不用再识别那些难认的文字,改成读图识图回答问题,如果程序判断你是人,你就可以开心地浏览网页,而如果判断你是机器人呵呵,那题目难度直接升级!它所应用的技术还包括机器学习,可识别风险机制,而除了根据问题的答案进行人机判断,程序还会根据用户的行为习惯比如打字的速度翻页点击的习惯来做出选择。

(升级版reCAPTCHA的工作原理)

据统计reCAPTCHA的技术可以大大提高识别准确率,总共可以有效节约用户每天50000小时的上网时间。而在3月13日推出的隐形验证码服务中,尽管谷歌公司并没有太多透露,但我们可以得知这个神级的验证码服务都不用点击“是不是机器人的选项”,程序可以依据日常的上网习惯直接作出判断。

(官网公布的代码)

新闻一发布,网上就开始有各种各样攻破隐形验证码的信息,如果这个黑科技投入使用,产品君心理这是一阵暗喜,不用再输入那些复杂的识别码即刻获得高效通畅的上网体验,好像有个隐形保镖为我们上网保驾护航。但由于谷歌公司还没有太多透露,而对于那些经常清理cookies的用户来说,还存在用户行为不好追踪等问题,还有依旧强大的OCR技术持续紧逼,产品君表示还需要再一步观测~~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容