scrapy执行流程图

image.png

用scrapy框架的时候，一定要先明白执行的顺序：
spiders的yeild将request发送给引擎，
引擎对request不做任何处理发送给调度器，
调度器( url调度器)，生成request交给引擎，
引擎拿到request，通过中间件进行层层过滤发送给下载器，
下载器在网上获取到response数据之后，又经过中间件进行层层过滤发送给引擎，
引擎获取到response数据之后，返回给 spisers，spiders的parse()方法对获取到的response数据进行处理，解析出items或者requests，
将解析出来的items或者requests发送给引擎，
引擎获取到items或者requests，将items发送给管道，将requests发送给调度器，
注意！只有当调度器中不存在任何request了，整个程序才会停止，（也就是说，对于下载失败的URL，Scrapy也会重新下载。）

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文

scrapy执行流程图

相关阅读更多精彩内容

友情链接更多精彩内容