爬虫scrapy框架的使用

2018-12-29

  1. 安装scrapy
    1.1 使用pycharm新建虚拟环境(python_scrapy)
    1.2 安装scrapy之前,先下载安装twisted(注意对应自己的python、操作系统版本!!),不安装twisted,直接安装scrapy会报错
    下载twisted包
# 使用pip install (下载的twisted文件位置)安装twisted
安装twisted

1.3 安装scrapy

pip install scrapy
安装scrapy

使用scrapy查看结果
  1. 在pycharm中使用scrapy框架
    2.1 创建爬虫项目,这里使用crawl模板,可以生成更接近我们想要的此次爬虫项目的初始版本。
# 创建项目名称
scrapy startproject <项目名称>
# cd到项目目录下,生成爬虫文件
scrapy genspider 模板名称 爬取的网址 --template=要使用的模板
创建的项目浏览

设置settings文件,防止被但爬虫机制发现,导致封掉IP


settings
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容