2020-09-09

爬虫的5个步骤

1、需求分析(不需要写成程序,是人处理的)

2、寻找网址(不需要写成程序,是人处理的)

3、下载网站返回内容(通过程序实现,程序包requests)

4、通过返回的信息找到需要爬取的数据内容(通过程序实现,正则表达式re,xpath对应的程序包lxml)

5、存储找到的数据内容(通过程序实现程序包mysql)需要学习python连接mysql

SCRAPY

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。