登录注册写文章

Python爬虫中Scrapy下操作pipeline.py文件

Python爬虫中Scrapy下操作pipeline.py文件

继续学习Python下的scrapy爬虫

本次试验，尝试通过python爬虫中的管道文件来保存数据，爬虫代码如下：

Scrapy.py

return与yield的异同：

同：都用来获取数据

异：return表示的是爬虫获得数据返回后就结束执行：调用了前面函数后，返回固定值，不执行后面语句，并将其存在(items=[])列表中,其语句写在for语句外面;

yield 会在爬虫执行过程中一直获取值，并继续执行yield后面的语句。若将其写在for语句里面，会一直获取数据返回管道，直到for循环结束，适用于处理爬取大数据时。

注意，要想调用pipeline.py，首先必须要在setting.py中配置pipeline，如图所示：

setting.py

在这里，数字的取值范围为1~1000，而且值越小，优先级越高。

接下来开始编写pipeline文件：

Pipeline.py

启动爬虫，结束后将在执行爬虫的目录中生成一个名为a.json的文件，文件预览入下图所示：

a.json

Done!

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Python中的协程
Coroutine in Python 引言: 本文出自David Beazley 的关于协程的PPT，现在笔者将...
LumiaXu阅读 1,639评论 4赞 8
爬虫之Scrapy框架--------> @_@
scrapy框架的流程图2018-11-01框架流程图 1、scrapy框架主要为个块（1）Scrap...
dream_seeker阅读 1,024评论 0赞 1
极迅云课（服务端教案）
一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容【Python简介】： Python 是一个...
_小老虎_阅读 5,846评论 0赞 10
永澄：有些错，犯了就犯了，闹情绪没用
1 如果算上周六、周日，我已经有四天没有上班了，因为：拉肚子。想了下原因，发现主要原因是吃了麻辣小海鲜，并且连续吃...
易仁永澄阅读 727评论 0赞 1
塑身食谱||美食季，各种海鲜做法赶紧收了吧！
1，油焖大虾食材：鲜虾300g、油适量、盐适量、葱丝适量、姜丝适量、生抽少量、料酒适量做法： 1)将新鲜大虾...
云香姐姐阅读 357评论 0赞 1

赞1赞

赞赏

手机看全文