scrapy相关

学习资料

书籍: Python爬虫开发与项目实战
该书作者博客:http://www.jianshu.com/u/c6176c13bf98

并发

CONCURRENT_REQUESTS与DOWNLOAD_DELAY的关系

DOWNLOAD_DELAY 的设置优先于CONCURRENT_REQUESTS,在设置了DOWNLOAD_DELAY 的情况下,即使设置了并发,也会串行执行,没有了并发.
scrapy中CONCURRENT_REQUESTS与DOWNLOAD_DELAY的联系

反反爬虫策略

Scrapy研究探索(七)——如何防止被ban之策略大集合

增量爬取

https://www.zhihu.com/question/19793879

效率提升

https://segmentfault.com/a/1190000009321902

数据存mongodb

mongodb 安装(windows)

http://www.cnblogs.com/lzrabbit/p/3682510.html
注意,最后安装为服务后,要自己去系统中开启服务.以后重启电脑它能自动开启.

scrapy中mongodb配置

http://www.mamicode.com/info-detail-1712208.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化...
    Evtion阅读 5,910评论 12 18
  • afinalAfinal是一个android的ioc,orm框架 https://github.com/yangf...
    passiontim阅读 15,569评论 2 45
  • Author:杜七 Date:2017.02.17 0 | 安装 Mac安装scrapy碰到问题解决方法 1 | ...
    杜七阅读 484评论 0 0
  • 我长得越来越高了而别人都说我长得还是像以前的我一样,可是我就生气了把脸一扭说到我才不像以前的我呢!也许正如...
    杨淇迪阅读 465评论 0 0
  • 毛毛你是个好姑娘 你要照顾好你自己 你可知世上没有什么好人 你别被他们都上了 毛毛你是个好姑娘 你要把持住你的欲望...
    HipEn阅读 418评论 0 1