登录注册写文章

Scrapy的基本使用（一）

Scrapy的基本使用（一）

产生步骤（一）

应用Scrapy爬虫框架主要时编写配置型代码

步骤1：建立一个Scrapy爬虫工程
选取一个目录（G:\pycodes\），然后执行以下命令

生成的工程目录：

产生步骤（二）

步骤2：在工程中生成一个Scrapy爬虫
进入工程目录然后执行以下命令

该命令作用：
（1）生成一个名为demo的spider
（2）在spiders目录下增加demo.py文件
（该命令仅用于生成demo.py，该文件也可以手工生成）

demo.py文件

parse()用于处理响应，解析内容形成字典，发现新的URL爬取请求

产生步骤（三）

步骤3：配置产生的spider爬虫
配置：
（1）初始的URL地址
（2）获取页面后的解析方式

产生步骤（四）

步骤4：运行爬虫，获取网页
在命令行下执行如下命令

demo爬虫被执行，捕获页面被储存在demo.html

demo.py代码的完整版

两个等价版本的区别：yield关键字的使用

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

scrapy学习笔记(有示例版）
scrapy学习笔记(有示例版）我的博客 scrapy学习笔记1.使用scrapy1.1创建工程1.2创建爬虫模...
陈思煜阅读 12,848评论 4赞 46
Scrapy爬虫入门教程一安装和基本使用
Python版本管理：pyenv和pyenv-virtualenvScrapy爬虫入门教程一安装和基本使用Scr...
inke阅读 63,813评论 12赞 130
《Learning Scrapy》（中文版）第3章爬虫基础
序言第1章 Scrapy介绍第2章理解HTML和XPath第3章爬虫基础第4章从Scrapy到移动应用第5章...
SeanCheney阅读 15,200评论 13赞 61
Scrapy爬虫入门教程十三 Settings（设置）
Python版本管理：pyenv和pyenv-virtualenvScrapy爬虫入门教程一安装和基本使用Scr...
inke阅读 61,415评论 6赞 99
又有多少人隐藏的黑暗如同刘鑫，陈世峰？
在生活和工作中接触形形色色的人，接触时间久了，都会有个比较全面的印象，其实人真的是一种即可以是天使，又可以是...
砥砺飞翔阅读 259评论 0赞 0

1赞2赞

手机看全文