- 爬取速度过快:time.sleep(n)
- 设置代理
- 设置User-Agent,把请求伪装成浏览器;不然会遇到 <Response [418]> 遭遇反爬
【Python】爬虫需要注意的事情
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 1. 网页抓取 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中抓取出来。在Python中有很多库可以用来...
- 在项目中遇到直接崩溃在CCDirector.h 系统文件,报错如下 'stack' file not found ...