scrapy shell

进入虚拟环境,运行以下命令

(scrapy) shanghaimei@shanghaimei:~$ scrapy shell "https://book.douban.com/"
```
[s]   shelp()           Shell help (print this help)
[s]   view(response)    View response in a browser
In [1]: 

会发现返回403

[s]   response   <403 https://movie.douban.com>

只要在命令上加请求头就正常返回了

 scrapy shell "https://movie.douban.com" -s USER_AGENT='Mozilla/5.0'

下面拿数据了,找打数据接口,执行

scrapy shell "https://movie.douban.com/j/search_subjects?type=tv&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0" -s USER_AGENT='Mozilla/5.0'
In [1]: view(response)
Out[1]: True
#返回一个txt的json数据文件
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容