登录注册写文章

Python Scrapy项目流程

Python Scrapy项目流程

1.安装Scrapy

pip install scrapy

2.创建Scrapy项目

python3 -m scrapy startproject pad_wool_crawl  // pad_wool_crawl：项目名称

3.创建Scrapy爬虫文件(在项目目录下执行)

python3 -m scrapy genspider 1818tuan 0818tuan.com  // 1818tuan：爬虫文件名称；0818tuan.com：爬取的域名

4.运行Scrapy爬虫文件(在项目目录下执行)

python3 -m scrapy crawl 1818tuan  // 1818tuan：爬虫文件名称

5.DeBug断点调试(参考文章)

// 1.在项目的文件夹下增加一个文件main.py（scrapy.cfg同等级中）
// 2.在scrapy的spider中设置断点，main.py中用debug调试则可。
from scrapy.cmdline import execute
import os
import sys
if __name__ == '__main__':
    sys.path.append(os.path.dirname(os.path.abspath(__file__)))
    execute(['scrapy','crawl','1818tuan']) // 1818tuan：爬虫文件名称

最后编辑于：2022.05.02 21:57:19

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

关于Scrapy爬虫项目运行和调试的小技巧（上篇）
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处...
孤城暮雨丶阅读 631评论 0赞 0
爬虫框架scrapy篇二——创建一个scrapy项目
1、创建scrapy项目在开始爬取之前，我们首先要创建一个scrapy项目，在命令行输入以下命令即可创建 xxx...
一只酸柠檬精阅读 6,586评论 0赞 0

Scrapy学习篇（三）之创建项目
创建项目创建项目是爬取内容的第一步，之前已经讲过，Scrapy通过scrapy startproject 命令...
cnkai阅读 3,846评论 0赞 1
手把手教你用Python实现分布式爬虫(四) - scrapy爬取技术文章网站
相关源码搭建scrapy的开发环境，本文介绍scrapy的常用命令以及工程目录结构分析，本文中也会详细的讲解xp...
JavaEdge阅读 5,087评论 0赞 1
python中用scrapy框架创建项目
最近在学scrapy框架进行简单爬虫学习，在此简单回顾一下创建项目流程思路。首先你的安装scrapy运行环境，在...
小沙弥哥阅读 1,878评论 0赞 2

赞1赞

赞赏

手机看全文