第五章:深入Python的set和dict

1. collections.abc模块介绍

# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 10:57'

from collections.abc import Mapping,MutableMapping
# dict是属于Mapping类型的
a = {}
print(type(a)) # dict
print(isinstance(a,MutableMapping)) # 是属于MutableMapping类型的
# 但是它不是通过继承的方式,而是实现了这个类中的一些方法,通过MutableMapping.register(dict)的方法

2.字典的常见操作

# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 11:04'
a = {'bob1': {'company': 'imooc'},
     'bob2': {'company': 'imooc2'}}
# clear 清空
# print(a)

# copy,浅拷贝,只拷贝了最外层的对象的引用,如果浅拷贝的
# 时候有可变对象的应用,则如果修改了原来的值,则可变对象的值也就跟着改变.
# 比如上面的a字典,key的拷贝不会出现问题.但是value的值本身也是一个引用类型,
# 它是可变的,拷贝的时候只是拷贝了这个内部字典的应用.所以如果它修改了,则原来的那个
# 对象也会跟着修改.
new_dict = a.copy()
new_dict['bob1']['company'] = 'imooc3'
print(a)
print(new_dict)
# {'bob1': {'company': 'imooc3'}, 'bob2': {'company': 'imooc2'}}
# {'bob1': {'company': 'imooc3'}, 'bob2': {'company': 'imooc2'}}

# fromkeys 将一个可迭代对象作为键,设定一个默认值,生成一个新字典
lst_keys = [1, 2, 3, 4]
new_dict = dict.fromkeys(lst_keys, 'a')
print(new_dict)

# get 根据键获取值.类似dict[key] 的用法.
# 但是dict[key]用法有一个缺点,如果元素不在字典中会创建一个新的键

value = new_dict.get(1, '')  # 如果key为1的不存在或者没有这个key,就会返回空
print(new_dict)
# value = new_dict[5] # 这里会报错
new_dict[5] = 6  # 这里会重新创建一个键,只有这个键存在的时候才是修改对应的值
print(new_dict, new_dict[5])

# items()key,value的元组的列表
print(new_dict.items(), new_dict.keys(), new_dict.values())
# items()返回的是一个元组列表, keys()返回的是键的列表,values()返回的值列表

for key, value in new_dict.items():
    print(key, value)

# setdefault('7','d')  创建一个键,并且设置默认值
default_value = new_dict.setdefault(7, 'd')
print(new_dict)

# update() 可以将一个字典或者一个赋值表达式,或者一个元组列表合并到字典中
new_dict.update({8: 'a'})
new_dict.update(boby=3, boby2=4)
new_dict.update([(9, 'f'), (10, 'g')]) # 放一个元组列表
print(new_dict)

3.和字典相关的类

1. 当我们要自定义一个字典的时候,不要使用直接继承自dict,因为有些操作会不生效

# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 13:42'


class MyDict(dict):
    def __setitem__(self, key, value):
        super().__setitem__(key, value * 2)

my_dict = MyDict()
my_dict['a'] = 3  # 这个时候调用的是__setitem__方法
print(my_dict) # {'a': 6}

# 直接在构造函数中初始化字典,这个时候调用的应该是__call__方法
my_dict = MyDict(b=5)
print(my_dict) # {'b': 5}

# 所以最好不要继承dict的方式,可以用继承collections模块的UserDict的方式

2. 使用继承UserDict的方式来实现自定义的字典.

# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 13:47'
from collections import UserDict


class MyDict(UserDict):
    def __setitem__(self, key, value):
        super().__setitem__(key, value * 2)

mydict = MyDict(a=4)
print(mydict)

mydict['b'] = 5
print(mydict)

3. 创建带有默认值的字典. collections中的defaultdict
字典之所以可以实现带有默认值,其实是它内部实现了__missing__方法,在UserDict类里面的__getitem__方法中会调用__missing__方法

    def __getitem__(self, key):
        if key in self.data:
            return self.data[key]
        if hasattr(self.__class__, "__missing__"):
            return self.__class__.__missing__(self, key)
        raise KeyError(key)

defaultdict之所以可以设置默认值就是因为实现了__missing__方法

4. set和frozenset

# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 13:58'
# set 集合 frozenset(不可变集合),无序,不重复
s = set('abcdef')
print(s)
s1 = set(['a', 'b', 'c', 'd'])
print(s1)
# 通过大括号的方式直接赋值
s2 = {'a', 'b', 'c', 'd'}
print(s2)

# 1.集合可以添加元素
s2.add('f')
print(s2)

s = frozenset('abcde')  # frozenset 是不可变的集合,可以作为字典的key
# s.add() 错误,不可变集合不能添加数据

# 2.clear() 清空集合
# 3.copy() 浅拷贝集合
# 4.pop() 弹出最后一个元素
# 5.remove() 删除一个集合元素
# 6.update()像set中添加一个集合
another_set = set('123')
s2.update(another_set)
print(s2)
# 7.difference(找不同)
ret_set = s2.difference(another_set)  # s - s2
print(ret_set)
# 8.求交集 &
ret_set = s2 & another_set
print(ret_set)
# 9.求并集
ret_set = s2 | another_set
print(ret_set)
# 10 in 对应的魔法方法__contains__
if 'a' in ret_set:
    pass
# 11. 判断是否是子集
if s2.issubset(another_set)

5. dict和set的实现原理

dict和list的性能对比:
1. dict的性能远远大于list
2. list的查找时间,hi随着list的数据的增多成正比例增加
3. 而dict的查找时间,不会随着字典的增大而增大.

字典的内部是通过hash表来映射的,什么是hash表,通过字典的key算出一个hash值,这个hash值对应一个位置,这个位置存放着字典的key和value.而因为hash表的存放是连续的,类似于数组,它查找和存取是根据偏移量来进行的,所以不需要遍历,就会速度很快.

注意:
set的值和字典的键的实现原理是一样的,都是可以hash的.
不可变对象,都是可hash的.str,forzenset,tuple,自己实现的类实现了__hash__都是可hash的对象.都可以作为字典的键

dict的内存花销大,但是查询速度快,自定义对象,或者python的自定义对象,都是用字典的方式来存储的.

dict的存储顺序和元素的添加顺序有关
dict中添加元素的时候,有可能会改变原来的位置.当插入的数据过多,重新分配内存的时候,dict就有可能将原来的顺序打乱.
所以一般使用dict的时候,不要期望它会一直维持某种顺序.