关于字体反爬

难度一:简单的编码替换字体。 解决方法:做成映射表即可
难度二:编码替换字体+编码随机。 解决方法:逐个比对x、y、on等坐标信息
难度三:编码替换字体+编码随机+字体变形。解决方法:OCR...

辅助工具:网页版 > FontEditor, python库 > fonttools

补充一个难度三的解决方案:使用Knn算法处理,具体见k近邻算法解决字体反爬手段

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 最近临时受命,要针对采集我司网站的爬虫进行反制。虽然不太熟悉这个领域,但既然分到咱这儿了,那就上呗,有啥说的,谁让...
    笑看河山0371阅读 7,781评论 10 15
  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 11,175评论 1 32
  • 前些日子,爬取起点中文网的过程中,发现代码没有错,是根据书上的教程来的,结果爬下的小说字数不对,百思不得其解。百度...
    叶儿爱琵琶阅读 1,347评论 1 0
  • 近日,由汉东省委,京州市委经多年悉心打造,联合推出的了全能优质偶像组合——汉东男子天团。 然而出道不久,该汉东男子...
    咪咪盟阅读 337评论 0 0
  • 姓名:王晓菁 公司:海南蔚蓝时代实业有限公司 378期反省一组【日精进打卡第195天】 【经典诵读】 《六项精进》...
    晓妖菁阅读 89评论 0 0