0. import requests
response = requests.get(url)
response.text
1. response响应对象的常用属性,方法
response.status_code # 响应的状态码
response.text # 响应的内容 str
response.content # 响应的内容 bytes
response.content.decode('utf8') # 通过尝试不同的字符集来正常显示中文
response.url # 响应的url
response.request.url # 响应对应的请求的url
response.headers # 响应的头 dict
response.request.headers # 请求头 dict
response.cookies # 响应的cookie CookieJar
response.request._cookies # 请求的cookie CookieJar
response.json() # 把返回的json字符串转换成python数据类型
2. 把cookieJar类型的对象转换为dict类型的cookies字典
requests.utils.dict_from_cookiejar(CookieJar_obj)
3. 发送get请求
requests.get(url,
headers={},
cookies={}/CookieJar,
params={查询字符串,不常用},
verify=False, # 处理安全认证证书造成的异常
timeout=3, # 超时3秒不返回就抛异常
proxies={代理ip键值对}
)
4. 发送post请求
requests.post(url,
data={请求体},
headers={},
cookies={}/CookieJar,
params={查询字符串,不常用},
verify=False, # 处理安全认证证书造成的异常
timeout=3, # 超时3秒不返回就抛异常
proxies={代理ip键值对}
)
5. session = requests.session()能够自动处理cookies,达到状态保持的效果
session.get/post(参数和requests.get/post一样)
6. 代理ip的使用
proxies={
'http': 'http://110.101.1.5:9527',
'https': 'https://110.101.1.5:9527',
}
7. retrying模块的简单使用
from retrying import retry
@retry(stop_max_attempt_number=最大尝试次数:int)