2.9.1.2Python-请求库_Requests

总目录:https://www.jianshu.com/p/e406a9bc93a9

Python-爬虫 - 子目录:https://www.jianshu.com/p/23cf57674bf1


Requests

官方手册:http://2.python-requests.org/zh_CN/latest/user/quickstart.html


requests是python实现的最简单易用的HTTP库,建议爬虫使用requests

requests是在urllib库上扩展的第三方库


概述

实例

import requests

#发起GET请求

url ="https://www.python.org/"

response=requests.get(url=url)


# 查看响应类型requests.models.Response

print(response)

<Response [200]>

print(type(response))

<class 'requests.models.Response'>


# 输出状态码

print(response.status_code)

200


# 输出响应内容类型

print(type(response.content))

<class 'bytes'>

print(type(response.text))

<class 'str'>


# 输出响应内容

print(response.content)    #获取源码的字节流格式,一般用于获得图片和视频

print(response.text)          #获取源码的文本格式(如要对获取源码进行分析用这个)


# 输出编码格式

print(response.encoding)

UTF-8


# 输出cookies

print(response.cookies)

<RequestsCookieJar[]>   #没有cookies


各种请求方式

# 发起POST请求

requests.post('http://httpbin.org/post')

# 发起PUT请求

requests.put('http://httpbin.org/put')

# 发起DELETE请求

requests.delete('http://httpbin.org/delete')

# 发送HEAD请求

requests.head('http://httpbin.org/get')

# 发送OPTION请求

requests.options('http://httpbin.org/get')



请求


get带参请求

下面说get带参请求的三种方式:

?+参数(?key1=value1)

import requests

response1 = requests.get("http://httpbin.org/get?key1=value1")

print(response1.url)

http://httpbin.org/get?key1=value1

params参数

import requests

parameter = {

"key1":"value1",

            "key2":"value2"

            }

response2 = requests.get("http://httpbin.org/get",params = parameter)

print(response2.url)

http://httpbin.org/get?key1=value1

还可以将一个列表作为值传入

import requests

parameter = {

"key1":"value1",

            "key2":["value21","value22"]

}

response3 = requests.get("http://httpbin.org/get",params = parameter)

print(response3.url)

http://httpbin.org/get?key1=value1&key2=value21&key2=value22


注意字典里值为 None 的键都不会被添加到 URL 的查询字符串里。

import requests

parameter = {

"key1":"value",

            "key2":None

}

response4 = requests.get("http://httpbin.org/get",params = parameter)

print(response4.url)

http://httpbin.org/get?key1=value


post带参请求

传递一个字典类型数据

import requests

payload = {

"key1":"value1",

    "key2":"value2"

}

response = requests.post("http://httpbin.org/post",data = payload)

print(response.text)

运行结果


传递一个元组类型数据

import requests

payload = (("key1","value1"),("key1","value2"))

response = requests.post("http://httpbin.org/post",data = payload)

print(response.text)

运行结果


解析json

import requests

response = requests.get('http://httpbin.org/get')

# 获取响应内容

print(response.text)

# 如果响应内容是json,就将其转为json

print(response.json())

# 输出的是字典类型

print(type(response.json()))

运行结果


定制请求头

import requests

#以知乎为例子

response =requests.get("https://www.zhihu.com")

print(response.text)#报错


new_headers={

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'

}

response = requests.get("https://www.zhihu.com",headers = new_headers)

print(response.text)#正常输出

运行结果



基本POST请求格式

import requests

# 设置传入post表单信息

data= {'name':'hanxuan', 'age':20}

# 设置请求头信息

headers = {

"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"

}

# 设置请求头信息和POST请求参数(data)

response = requests.post('http://httpbin.org/post', data=data, headers=headers)

print(response.text)

运行结果

响应

获得响应属性

import requests

response = requests.get('http://www.jianshu.com/')

# 获取响应状态码

print(type(response.status_code),response.status_code)

# 获取响应头信息

print(type(response.headers),response.headers)

# 获取响应头中的cookies

print(type(response.cookies),response.cookies)

# 获取访问的url

print(type(response.url),response.url)

# 获取访问的历史记录

print(type(response.history),response.history)

运行结果


高级操作


文件上传

import requests

files = {'file': open('s1.ico', 'rb')}

# 往POST请求头中设置文件(files)

response = requests.post('http://httpbin.org/post', files=files)

print(response.text)

运行结果

获取cookies

import requests

response = requests.get('http://www.baidu.com')

print(response.cookies)

for key, valuein response.cookies.items():

    print(key, ':', value)

<RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>]> 

BDORZ : 27315


会话维持

import requests

session = requests.session()

# 使用seesion去请求保证了请求是同一个session

session.get('http://httpbin.org/cookies/set/number/12456')

response = session.get('http://httpbin.org/cookies')

print(response.text)

运行结果


设置代理

普通的代理设置

import requests

proxies = {

    "http":"http://10.10.1.10:3128",

    "https":"http://10.10.1.10:1080",

}

requests.get("http://example.org", proxies=proxies)

当然也可以带用户名和密码:

proxies={"http":"http://user:pass@10.10.1.10:3128/",}

超时设置

import requests

from requests.exceptionsimport ReadTimeout


try:

    # 设置必须在500ms内收到响应,不然或抛出ReadTimeout异常

    response = requests.get("http://httpbin.org/get", timeout=0.5)

    print(response.status_code)

except ReadTimeout:

    print('Timeout')

200



异常处理

import requests

from requests.exceptionsimport ReadTimeout, ConnectionError, RequestException


try:

    response = requests.get("http://httpbin.org/get", timeout=0.5)

    print(response.status_code)

except ReadTimeout:

    # 超时异常

    print('Timeout')

except ConnectionError:

    # 连接异常

    print('Connection error')

except RequestException:

    # 请求异常

    print('Error')

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容