登录注册写文章

Scrapy框架步骤

老夫愿闻其翔

Scrapy框架步骤

简单了解一下Scrapy框架于操作步骤

什么是Scrapy框架呢？

scrapy是python下的数据爬取集框架，使用scrpay爬取数据，速度更快。并且可以很快的搭建爬取程序。

1.需求工具 pycharm 小说网的域名 (www.top.china.com)

第一步—–创建文件

    scrapy startproject myspider

新建爬虫文件

scrapy genspider zzw china.com

第二步——将创建在桌面上的scrapy文件用pycharm打开:

这是创建成功后在pycharm中的显示

新建爬虫文件

第三步——–编写爬虫代码

这个代码是你创建好文件以后里面就有
3.代码思路
1)请求导航条上的每个按钮对应的页面
2)分别解析每个页面的列表(主要获得网页的详情url)
3)请求详情url,解析网页的详细信息(周排名，反链接数，简介，网站排名，得分，网站图片地址)
4)根据下载地址下载到本地

找到列表页的url：

第四步——设置item /与存储有关

将需要存储的信息写入,如图所示:

第五步——配置pipelines/与储存有关

第六步——在Terminal中输入运行命令

   scrapy+crawl+爬虫名称

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

《Learning Scrapy》（中文版）第3章爬虫基础
序言第1章 Scrapy介绍第2章理解HTML和XPath第3章爬虫基础第4章从Scrapy到移动应用第5章...
SeanCheney阅读 15,219评论 13赞 61
刘霞5.23日课总结：反求诸己
5.23日课总结：反求诸己 —— 行有不得，反求诸己。很多的心灵鸡汤书籍里都有对此的解释，自己是一切的根源；改变不...
423429d90f38阅读 1,462评论 0赞 2

在这之前，我最害怕的动物是狗
我是男生，但是我很怕狗。有多害怕？你们有没有试过半夜做噩梦惊醒，是因为被狗追…… 直到如今，我每天晚上下课，当...
JoyfulMoments阅读 4,014评论 0赞 2
感伤之极！
2018.4.27.孝贤今晚要上楼（26楼）与奶奶一起睡觉！他愿意听奶奶为他讲故事！但爸爸妈妈不让他在楼上住！爸爸...
姜每文阅读 2,299评论 0赞 0
OpenGL 学习 08 - 球体世界
学习书籍： OpenGL 超级宝典(中文第五版) 密码:fu4w 书籍源码：OpenGL 超级宝典第五版源代码 ...
执着丶执念阅读 4,987评论 0赞 1

赞1赞

赞赏

手机看全文