- BOT_NAME——爬虫名字
- USER_AGENT—— 请求头
- EXTENSIONS——扩展
- ITEM_PIPELINES——管道
- DEPTH_PRIORITY = 0——优先级:0广度优先 1为广度优先
- USER_AGENT —— ua(中间件)
- DOWNLOADER_MIDDLEWARES —— 下载中间件
- SPIDER_MIDDLEWARES —— 爬虫中间件
- DOWNLOAD_DELAY —— 下载延迟
- ROBOTSTXT_OBEY —— 爬虫协议,即 robots 协议
- CONCURRENT_REQUESTS —— 并发线程,默认16个
- COOKIES_ENABLED —— cookies禁用
- TELNETCONSOLE_ENABLED——爬虫监听开关
- DEFAULT_REQUEST_HEADERS——请求头信息
scrapy——settings
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
相关阅读更多精彩内容
- 一、学校管理(申增富) 1、我们的管理思想是“人人都是学校的主人翁”,要发现问题解决问题,要建立值周校长长效机制。...
- 看到一则这样的评论“韩剧是你在所有人都闪闪发光中唯独看中了平凡渺小的我,日剧是在所有人眼中都平凡又渺小的我们却在彼...