240 发简信
IP属地:山西
  • 120
    Scrapy学习笔记(6)-反爬虫与反反爬虫策略

    前言 到目前为止我们已经写了好几个爬虫,虽然已经可以实现数据采集,但是我们的爬虫其实是在”裸奔”,因为没有加任何的伪装,很容易就可以被远程服务器识别出来,这也就意味着我们的爬...

  • 120
    反反爬虫|应对网站反爬虫策略,更高效地爬大量数据

    工欲善其事必先利其器知己知彼百战不殆 反反爬虫|应对网站反爬虫策略,更高效地爬大量数据 1.Headers限制 这应该是最常见的,最基本的反爬虫手段,主要是初步判断你是否是真...