昨天把图片抓下来之后我就在想
下一步干什么?
思来想去,盯上了很难搞的<b>验证码</b>
看了不少教程之后,总结一下简单的图片验证主要就是三个步骤:
图片降噪
图片切割
图像文本输出
也不能直接照着别人的代码自己再写一遍吧?
所以就想起了那天筛选论坛时候(最后选了一加)锤子科技的论坛需要验证码,而且稍微比最简单的难,但是没有难到12306那么难,说不定我顺带学习一下机器学习,岂不是美滋滋?
稍微尝试了一下登录页面,我判断了一下锤科论坛的登录过程应该是这样的:填写正确的账号密码(不知道有预登录然后加密的过程没有),然后服务器返回一个验证码,然后才能登录。不像普通网站那样直接就把验证码给你了。
想了想先抓包吧:
正想再请求一下再抓一下看看,结果这次让我直接登录了,也没有要验证码,我心想:我C,想来拿你做实验,结果你把我的困难消除掉了?这么尴尬?
看了一下chrome,原来我打开调试的时候chrome把自己伪装成了手机,然后自动登上了手机页面:
当然,锤科肯定还有别的反爬虫的技术我因为没怎么搞也没有碰上,不过这不是主题,我想说的还是那句话: