Scrapy

Scrapy简介


Scrapy是一个健壮的网络框架,它可以从各种数据源中抓取数据。
Scrapy能够识别残缺的HTML。
Scrapy既不存储数据,也不索引数据。它只用于抽取数据。它对很多数据库也都有所支持。

安装Scrapy


因为我安装了Anaconda,所以直接在其下面安装

conda install scrapy

shell命令

进入scrapy的URL调试控制台

scrapy shell [--pdb] www.xxx.com

--pdb: 启用交互式调试

第一个Scrapy项目

scrapy startproject properties

编写爬虫

创建一个名为basic的默认爬虫

scrapy genspider basic 网址

运行爬虫

scrapy crawl 爬虫名
scrapy parse --spider=爬虫名 网址

保存文件

scrapy crawl 爬虫名 -o xxx.json
scrapy crawl 爬虫名 -o xxx.jl
scrapy crawl 爬虫名 -o xxx.csv
scrapy crawl 爬虫名 -o xxx.xml

Item加载器

ItemLoader
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 这些都是原来在微博上的文章,慢慢搬到这里吧 (一)安装和测试 学习网络爬虫也是进行自然语言处理的前期准备工作,爬虫...
    yahal阅读 413评论 0 1
  • https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 下载即可。 安装...
    怂恿的大脑阅读 1,403评论 0 7
  • scrapy是一个为爬取网站,提取结构化数据而创建的一个爬虫框架,scrapy基于python,是目前python...
    天剑飞心阅读 2,231评论 0 0
  • 在学校做了五天牢,画了两幅画,考了三场试,今个终于回来了!画画不容易,在老师眼皮子底下画画更加不容易!宝宝在此厚...
    孤城夜玖阅读 268评论 0 0
  • 看图说话的故事感觉是在多年以前刚学作文的时候写得多的,而后就变成自由发挥了,一直觉得看图说话很困难,因为说简单了就...
    一元Yvo阅读 812评论 0 0

友情链接更多精彩内容