Selenium自动化测试:如何跳过绕不过的登录验证

背景

先说一下背景,今天的这个主题是来源于我之前工作中的实战经历,当时在做一个爬虫项目,遇到了非常牛逼的反爬验证,就是之前提到过的某度指数数据,当时费了九牛二虎之力才用selenium+firefox登录成功,可是好景不长,没过多久就发现登录出现了图形验证码了,像下方这样的,出现这东西总不能手工去输入吧,兵来将挡水来土掩,一言不合就开干!马上就想到了图形的OCR识别技术,这个也不麻烦,有很多现成的OCR框架和接口可以直接用,我这里就用了某度自家的OCR识别接口,上线后发现成功率不是很高,但是多刷几次遇到不太复杂的图像还是可以通过的,所以就这样解决了第一次对抗遇到的问题……


可是过了几个月,每个长假过后,突然发现DB的数据没有更新了,没有新数据入库,那就得去追溯爬虫是不是出问题了。连上线上机器,看了一下,什么时候开始登录给我加了短信验证码。。。。当时有种想骂人的冲动,这么变态。。。没办法继续对抗,出现短信验证码就必须要有一个手机客户端来接收验证码数据了,常规做法那只能写一个手机端的app应用去获取到验证码短信,然后再发送给服务端,然后再填入对应的验证码,登录成功,简单数据流程图如下:


思考

上面的反爬对抗已经到第二阶段了,虽然我用上面的手机接收验证码的方式可以解决短信验证码的问题,可是有没有想过后面还有第三阶段、第四阶段……的对抗,这样搞下去太累了,到最后只会对自己越来越不利,毕竟我们爬虫方是“进攻者”,抗到最后肯定会封我IP,各种折腾。。。所以在一个夜深人静的晚上,思考了一下:为什么会被对方加设各种登录门槛?无非不是对方检测到我的登录行为非常规,可是我已经是用模拟人工操作的selenium去做了,这还能被识别出来,还有其他方法吗?


改进

仔细思考一下,selenium启动浏览器的过程,默认情况下它是加载一个纯净版的浏览器(无插件+无浏览器缓存数据),也许这就是被判断为机器人的依据之一。那么为何启动时不配置上浏览器的本地缓存数据呢?对啊,为什么?想到就了试试:
1、先人工打开Firefox浏览器,输入某度指数地址,登录账号,记得勾选记住密码(将用户和密码数据写入浏览器本地缓存),关闭浏览器;
2、验证一下:再次打开浏览器,输入地址,如果不用登录,可以直接到数据页面,那么验证ok;
3、修改代码:之前的登录部分封装起来,因为本地缓存数据有一个有效期,所以在进入界面后如果发现没登录还是要再登录下的,new FirefoxDriver的时候加上使用本地浏览器配置,如下:

System.setProperty("webdriver.firefox.bin", SpiderConfig.getValue("webdriver.firefox.bin"));
FirefoxProfile firefoxProfile = new FirefoxProfile(new File(SpiderConfig.getValue("webdriver.firefox.profile.path")));
FirefoxDriver driver = new FirefoxDriver(firefoxProfile);

就是这么easy,就是这么随意,就这三行代码搞定!


总结

这个例子再一次证明,有时候遇到难题,不要慌,不要硬抗,多思考多分析,还是那句话:多码多实践!!!纸上得来终觉浅,绝知此事要躬行。

原文来自下方公众号,转载请联系作者,并务必保留出处。
想第一时间看到更多原创技术好文和资料,请关注公众号:测试开发栈

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350