Python day20:包与常用模块

今日内容:
1.包的使用

2.json与pickle模块

3.hashlib模块

一.包的使用
什么是包:包是一个含有init文件的文件夹,本质就是一个模块,是用来被导入的

首次导入包这种模块发生的两件事

​ 1.创建模块的名称空间,运行包下的init文件,将运行过程中产生的名字都丢到模块的

名称空间中

​ 2.在当前位置拿到包的名称,这个名称是指向init文件的名称空间,即模块.名字,这个名字是来自init的

​ 1.包的导入

​ 文件在包的init文件中,有两种导入方式:

​ 1.用绝对路径导入:此方法,可以在本包中导入其他任意位置的其他包,但是需要把包加入到sys.path中

#文件init
from p.m1 import f1
#文件m1
def f1():
    print('from f1')
#用户使用
import sys
from p import f1

sys.path.append(包的路径)
f1()

2.用相对路径:此方法用.表示当前文件夹,..表示上一次,此后每加一个点都会到上一层目录,但是不会超过根目录

# 当m1与init同级时候
from .m1 import f1
#文件m1
def f1():
    print('from f1')
#用户使用
from p import f1

二.json模块与pickle模块
1.什么是序列化与反序列化

我们把对象(或变量)从内存变成可存储或可传输的过程称之为序列化,在python中被称为picking

​ 自定义的类的实例如何保存在一个文件中?如何从文件中读取数据,并让他们在内存中再次恢复成自己对应的类的实例?

​ 按照某种规则,把内存中的数据保存到文件中,文件是一个字节序列,所以必须要把内存数据转换成为字节序列,输出到文件,这就是序列化;反之,从文件的字节恢复到内存,就是反序列化

​ 2.为何要序列化

​ 1.存档:把内存的数据持久化到硬盘中,在python中推荐pickle

​ 2.跨平台交互数据,推荐json

​ 3.如何序列化

​ ①:在我们还没学习模块前的序列化与反序列化(之后不要使用,low)

# 1.序列化
items=["无尽之刃","魔宗","纳什之牙"]

dic_str=str(items)

with open('db.txt',mode='wt',encoding="utf-8") as f:
    f.write(dic_str)

# 2.反序列化
with open('db.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()  # "['无尽之刃', '魔宗', '纳什之牙']"
    items=eval(data)
    print(items[0])

②:使用json模块

​ 优点:通用性强

​ 缺点:无法识别所有python类型

​ 注意:在json中,元组也可以被写入文件,但是是按照列表的方式存取,load出来后的类型也是list

# 序列化
import json
dic={'name':'alvin','age':23,'sex':'male'}
with open('db.txt',mode='wt',encoding='utf-8') as f:
    json.demp(dic,f)


# 2.反序列化
import json
with open('db.txt',mode='rt',encoding='utf-8') as f:
    json.load()

③:pickle模块

​ 优点:可以识别所有python类型

​ 缺点:只能用于python,不使用其他

import pickle

s = {1,2,3,4,5}

res=pickle.dumps(s)
# print(res,type(res))
with open('a.pkl',mode='wb') as f:
    f.write(res)


with open('a.pkl',mode='rb') as f:
    data=f.read()
    s=pickle.loads(data)
    print(type(s))

三.hashlib模块

​ 1.hashlib模块:hash是一种算法(包括md5,md256,md512等等),我们为该算法传入内容(不单单是文本内容,只要是有用二进制存的都可以),该算法会计算得到hash值

hash算法的三种特性:

​ 1.如果传入的内容一样,且采用的算法一样,得到的结果必定相同(常用来检验文件传输后的完整性)

​ 2.hash值的长度由采用的算法决定,与文件大小无关

​ 3.hash值不可逆,只能从文件计算得出hash值,不能从hash值反解出文件内容(常用于加密)

​ hashlib演示

import hashlib

m=hashlib.md5()
m.update("身无彩凤双飞翼".encode('utf-8'))
m.update("心有灵犀一点通".encode('utf-8'))
res=m.hexdigest()
print(res)
# 结果:
c3efa694b7b7abc43f64634fc6d7b12f

# 如果传入的内容一样,且采用的算法一样,得到的结果必定相同
m.update("身无彩凤".encode('utf-8'))
m.update("双飞翼".encode('utf-8'))
m.update("心有灵犀".encode('utf-8'))
m.update("一点通".encode('utf-8'))
res=m1.hexdigest()
print(res)
# 结果:
c3efa694b7b7abc43f64634fc6d7b12f

# 计算图片文件的hash值
m2=hashlib.md5()
with open('aaa.png',mode='rb') as f:
    for line in f:
        m2.update(line)
    print(m2.hexdigest())
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。