urllib3

u=4012717948,1091859348&fm=173&app=49&f=JPEG.jpg

一.来自官方网站的解释:

urllib3是一个功能强大,对SAP 健全的 HTTP客户端。许多Python生态系统已经使用了urllib3,你也应该这样做。

二. 安装urllib3库

pip install urllib3
不懂的请百度(开个玩笑,都是基础怎么可能不会~~~)

通过urllib3访问一个网页,那么必须首先构造一个PoolManager对象,然后通过PoolMagent中的request方法或者 urlopen()方法来访问一个网页,两者几乎没有任何区别。

class urllib3.poolmanager.PoolManager(num_pools = 10,headers = None,** connection_pool_kw )

生成一个PoolManager所需要的参数:

参数 描述
num_pools 代表了缓存的池的个数,如果访问的个数大于num_pools,将按顺序丢弃最初始的缓存,将缓存的个数维持在池的大小。
headers 代表了请求头的信息,如果在初始化PoolManager的时候制定了headers,那么之后每次使用PoolManager来进行访问的时候,都将使用该headers来进行访问。
** connection_pool_kw 是基于connection_pool 来生成的其它设置

解释来自:[https://blog.csdn.net/qq_42415326/article/details/90794150](https://blog.csdn.net/qq_42415326/article/details/90794150)

当访问网页完成之后,将会返回一个HTTPResponse对象,可以通过如下的方法来读取获取GET请求的响应内容:

import urllib3
http = urllib3.PoolManager()
resp1 = http.request('GET', 'http://httpbin.org')
print(resp1.status)
print(resp1.data.decode())

三.详解

构造请求(request)

1导入包

import urllib3

2.实例化一个PoolManager对象构造请求。

http = urllib3.PoolManager()

3.用request方法发送一个请求

resp1 = http.request('GET', 'http://httpbin.org')

3.1.用request方法发送任意一个http请求

resp1 = http.request(
'POST',
 'http://httpbin.org/post',
fields={'hello':'weixin'}
)

四.小案例

这个是自己写的....很渣渣的感觉

import urllib3
import re
import os
for i in range(1,4):
    #创建空字典,列表准备把名字,图片url装进字典
    dict_img={}
    list_name=[]
    list_img=[]
    # 网址
    url = "http://www.weimeitupian.com/page/{}".format(i)
    http = urllib3.PoolManager()
    r = http.request('GET', url)
    name= re.findall(b'target=.*?title="(.*?)"',r.data,re.S)
    # 将标题丢进列表
    for i in name:
        i=i.decode()
        list_name.append(i)
    img_url = re.findall(b'<div class="postlist">.*?<img src="(.*?)".*?alt=.*?</div>',r.data,re.S)
    # 将图片url丢进列表
    for i in img_url:
        i=i.decode()
        list_img.append(i)
    #合成字典
    dict_img=dict(zip(list_name,list_img))
    # print(dict_img)
    #图片url的请求前面部分
    head = 'http://www.weimeitupian.com'

    for key in dict_img:
        # print(dict_img[key])
        # 判断是否需要加图片url的请求前面部分
        if head in dict_img[key]:
            url = dict_img[key]
        else:
            url='http://www.weimeitupian.com'.format(dict_img[key])

        #判断图片格式
        if dict_img[key][-4:] == '.jpg' or dict_img[key][-4:] =='jpeg':
            geshi ='jpg'
        elif dict_img[key][-4:] =='.gif':
            geshi ='gif'
        elif dict_img[key][-4:] =='.png':
            geshi = 'png'

        ##构造请求数据
        image = http.request('GET', url)
        data = image.data

        ##尝试写入
        try:
            os.mkdir('{}'.format(key))
        except FileExistsError as e:
            print(e,':文件夹已存在')
        with open('{0}\\{0}.{1}'.format(key,geshi),'wb+')as f:
            f.write(data)
print('done!')

再看一下大佬写的......

import os
import re
import time
import urllib3
from threading import Thread



def image_request(url,item,image_path):
    # 对图片进行请求
    print('正在请求{}'.format(url))
    image_content = req.request('GET', url)  # 网络io请求
    # 文件写入图片
    print('开始写入图片')
    # with open('{}/{}'.format(image_path, item[0].split('/')[-1]), 'wb') as f:
    #     f.write(image_content.data)


def save_images(items):
    t_list = []
    for item in items:
        if not item[0]:
            continue
        # 构造图片存储路径
        image_path = './images/{}'.format(item[1])
        # 判断文件夹是否存在,不存在就创建
        if not os.path.exists(image_path):
            os.mkdir(image_path)
        # 判断图片url地址是否包含域名
        image_url = item[0]
        if not 'http' in item[0]:
            image_url = '{}{}'.format('http://www.weimeitupian.com',item[0])

        # 创建线程实例
        t = Thread(target=image_request,args=(image_url,item,image_path))
        # 启动线程
        # t.start()
        # t.join()
    #
        t_list.append(t)

    for t in t_list:
        t.start()
    for t in t_list:
        t.join()

if __name__ == '__main__':
    req = urllib3.PoolManager()
    start_time = time.time()
    for page in range(1,2):
        print('正在下载第{}页的图片数据...'.format(page))
        data = req.request('GET','http://www.weimeitupian.com/page/{}'.format(page))
        # 通过正则表达式 匹配标题和图片地址
        items = re.findall(r'</a></div>-->.*?<img src="(.*?)" alt="(.*?)" class="thumb" />',data.data.decode(),re.S)
        save_images(items)
    print('耗时:{}秒'.format(time.time()-start_time))

真的是没有对比就没有伤害......看来自己的路还长着呢......加油~~~~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容