067 Python语法之Requests库

总体介绍

  1. 由于原生urllib不好用,所以作者写了这个库

库的地址

  1. http://docs.python-requests.org/en/master

学好Requests的意义

  1. 这是一个网络时代
  2. 爬虫的利器
  3. 服务器编程基础(Restful API)
  4. 自动化测试接口(Python + Requests)

环境准备

  1. http://httpbin.org/
  2. pip install gunicorn httpbin
  3. 使用gunicorn httpbin:app,可以在本地访问这个网址

Http基本原理

Request

  1. GET/HTTP/1.1
  2. Start Line:请求方法,请求地址,请求协议
  3. Host:www.baidu.com
  4. User-Agent:Curl/7.43.0
  5. Accept:/

Response

  1. 200 OK Start Line(状态码)
  2. Headers

简单小程序

  1. urllib,urllib2是独立的关系和模块
  2. Requests库使用了urllib3(多次请求重复利用一个socket)

1. 使用urllib

import urllib
import urllib.request
import urllib.response

response = urllib.request.urlopen("http://httpbin.org/")
print(response.info())          # header
print(response.getheaders())    # 键值对形式的header
print(response.getcode())       # code
print(response.read().decode("utf-8"))  # 网页数据

2. 使用Requests

import requests

response = requests.get("http://httpbin.org/ip")
print(response.headers)     # header键值对形式
print(response.status_code) # 状态码
print(response.text)        # 网页数据
print(response.json())      # Json数据
print(type(response.json()))      # Json数据,字典类型

发送请求(Request)

请求方法

  1. GET:查看资源
  2. POST:增加一个资源
  3. PUT:创建一个已知资源,对原有资源进行修改
  4. PACTH:对已知资源进行局部更新(对put的补充)
  5. DELETE:删除资源
  6. HEAD:查看响应头
  7. OPTIONS:查看可用请求方法

带参数的请求

  1. requests.get(url,params={"key1":"value1"})
  2. requests.post(url,data={"key1":"value1","key2":"value2"})
  3. requests.post(url,json={"key1":"value1","key2":"value2"})

请求异常处理(exceptions包中的异常)

  1. BaseHTTPError
  2. ...

自定义Requests

from requests import Request, Session
s = Session()   # 初始化一个Session
headers = {"User-Agent":"fake1.3.4"}    # 自定义头部
req = Request("GET",url,auth=(username,pwd),headers=headers)    # 定义一个请求
prepped = req.prepare() # 请求准备

response = s.send(prepped,timeout=5)   # 用Session发送,请求超时时间5秒

接收响应(Response)

Http状态码

  1. 1XX:消息
  2. 2XX:请求成功
  3. 3XX:重定向
  4. 4XX:客户端错误
  5. 5XX:服务器错误

属性

  1. status_code:回应码
  2. reason:回应状态(OK)
  3. headers:头部
  4. url:请求地址
  5. elapsed:请求耗时
  6. request:请求对象
  7. encoding:编码信息
  8. raw:原始对象
  9. content:bytes类型内容
  10. text:解码过了
  11. json:获取json信息

下载图片/文件

headers = {"User-Agent":"浏览器信息"}
url = "网址"
response=requests.get(url, headers=headers, stream=True)
from contextlib import closing
with closing(requests.get(url,headers=headers,stream=True)) as response:
    # 打开文件
    with open("demo1.jpg","wb") as fd:
        # 每128字节写入一次
        for chunk in response.iter_content(128):
            fd.write(chunk)

事件钩子

import requests

def get_key_info(response,*args,**kwargs):
    """回调函数
    """
    print(response.headers["Content-Type"])

requests.get(url, hooks=dict(response=get_key_info))

进阶Cookie,Session

HTTP认证

requests.get(url, auth=(username,pwd))  # 基本认证AUTH

OAUTH认证

headers = {"Authorization":"token 具体的token"}
response = requests.get(url,headers = headers)
print(response.request.headers)



import requests

class GithubAuth(AuthBase):
    def __init__(self, token):
        self.token = token
    
    def __call__(self, r):
        r.headers["Authorization"] = " ".join(["token", self.token])
        return r

def auth_advanced():
    auth = GIthubAuth(token具体信息)
    response = requests.get(url,auth=auth)
    print(response.text)

oauth_advanced()

Proxy代理(中介)

  1. 启动代理服务Heroku
  2. 在主机1080端口启动Socket服务
  3. 将请求转发到1080端口
  4. 获取响应的资源
  5. pip install "requests[socketv5]"
  6. Requirement already satisfied(要求已经支持)
  7. proxy={'http':'socks5://127.0.0.1:1080'}
  8. result = requests.get(url, proxies=proxy, timeout=10)

Cookie,Session

  1. Session是服务器端用于保留一些信息的机制
  2. Cookie是浏览器端用于保留信息的一些机制
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容