Scrapy官方中文教程
https://scrapy-chs.readthedocs.io/zh_CN/0.24/index.html
Scrapy框架
创建项目
在你打算存储代码的目录下进入命令行运行下面命令创建新的项目
scrapy stsrtproject 项目名称
该命令将会创建包含项目如下目录
项目名称/
scrapy.cfg
项目名称/
__init__.py
items.py
pipelines.py
settings.py
spiders/
__init__.py
...
创建模块
scrapy genspider 模块名 example.webscraping.com --template=crawl
启动项目
scarpy crawl country
定义items
items保存爬取到的数据的容器;使用方法和python中的字典类似;并且提供了额外保护机制来避免拼写错误导致的未定义字段错误