python笔记

移动设备id
https://www.jianshu.com/p/9954d0394832

1.在使用scrapy爬虫的时候，我们常常使用xpath来获取html标签，但是我们经常会用到提取的方法，有两种提取的方法，分别是：
extract():这个方法返回的是一个数组list，，里面包含了多个string，如果只有一个string，则返回['ABC']这样的形式。
extract_first()：这个方法返回的是一个string字符串，是list数组里面的第一个字符串。

2.列表生成器：list(range(1, 11))
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

scrapy genspider douban movie.douban.com

cd venv\Scripts
.\activate

scrapy crawl douban -o douban.csv

scrapy crawl douban -o douban.csv --nolog

输出依赖项清单
pip freeze > requirements.txt
根据依赖项清单安装依赖
pip install -r requirements.txt

生产excel

image.png

settings.py
LOG LEVEL ="WARNING" #将Scrapylog日志调整为最低级别是Waring

1655701111396.png

最后编辑于：2022.06.20 12:59:03

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

赞1赞

赞赏

手机看全文

python笔记

相关阅读更多精彩内容

友情链接更多精彩内容