登录注册写文章

爬虫：02.Urllib库

爬虫：02.Urllib库

1. Urllib

Python内置的HTTP请求库

urllib.request············# 请求模块
urllib.error···············# 异常处理模块
urllib.parse··············# 提供了对url进行拆分、合并等处理方法
urllib.robotparser······# 针对网站的robots.txt文件进行识别，判断站点是否可爬取

1.1 不同Python版本Urllib库区别

HTTP请求测试站点：http://httpbin.org/post

# python2
import urllib2
response = urllib2.urlopen('http://www.baidu.com')

# python3
# urlopen在Python3，已被迁移到urllib.request库中
import urllib.request
response = urllib.request.urlopen('http://www.baidu.com')    # byte类型

1.2 urlopen

urlopen

1.3 响应

响应

1.4 Request

Request

1.5 Handler

Handler

1.6 Cookie

Cookie

1.7 异常处理

异常处理

1.8 URL解析

urlparse

urlunparse

urljoin

urlencode

上一章：爬虫：01.爬虫初探
 下一章：爬虫：03.Requests库

最后编辑于：2019.05.20 10:11:25

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

python常用库之urllib和urllib3
https://www.cnblogs.com/xiao-apple36/p/8433400.html urlli...
长风哥哥阅读 5,244评论 0赞 1
urllib的用法
什么是Urllib： Urllib是python内置的HTTP请求库包括以下模块 urllib.request ...
啊烟雨阅读 1,303评论 0赞 5
爬虫第三讲：基本的urllib库
Urllib库是python内置的库什么是Urllib 1.urllib.request 请求模块2.ur...
谢谢_d802阅读 713评论 0赞 3
urllib vs urllib2 vs requests
urllib and urllib2 区别 –博主提示：下面的是python2中的用法，python3需要做出相应...
sunnyRube阅读 1,425评论 0赞 1
2018-08-28
爬虫的基本流程一、发送HTTP请求（Request）通过Python库向目标站点发送HTTP请求，等待服务器响应...
晓枫_0544阅读 796评论 0赞 0

赞1赞

赞赏

手机看全文