1. collections.abc模块介绍
# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 10:57'
from collections.abc import Mapping,MutableMapping
# dict是属于Mapping类型的
a = {}
print(type(a)) # dict
print(isinstance(a,MutableMapping)) # 是属于MutableMapping类型的
# 但是它不是通过继承的方式,而是实现了这个类中的一些方法,通过MutableMapping.register(dict)的方法
2.字典的常见操作
# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 11:04'
a = {'bob1': {'company': 'imooc'},
'bob2': {'company': 'imooc2'}}
# clear 清空
# print(a)
# copy,浅拷贝,只拷贝了最外层的对象的引用,如果浅拷贝的
# 时候有可变对象的应用,则如果修改了原来的值,则可变对象的值也就跟着改变.
# 比如上面的a字典,key的拷贝不会出现问题.但是value的值本身也是一个引用类型,
# 它是可变的,拷贝的时候只是拷贝了这个内部字典的应用.所以如果它修改了,则原来的那个
# 对象也会跟着修改.
new_dict = a.copy()
new_dict['bob1']['company'] = 'imooc3'
print(a)
print(new_dict)
# {'bob1': {'company': 'imooc3'}, 'bob2': {'company': 'imooc2'}}
# {'bob1': {'company': 'imooc3'}, 'bob2': {'company': 'imooc2'}}
# fromkeys 将一个可迭代对象作为键,设定一个默认值,生成一个新字典
lst_keys = [1, 2, 3, 4]
new_dict = dict.fromkeys(lst_keys, 'a')
print(new_dict)
# get 根据键获取值.类似dict[key] 的用法.
# 但是dict[key]用法有一个缺点,如果元素不在字典中会创建一个新的键
value = new_dict.get(1, '') # 如果key为1的不存在或者没有这个key,就会返回空
print(new_dict)
# value = new_dict[5] # 这里会报错
new_dict[5] = 6 # 这里会重新创建一个键,只有这个键存在的时候才是修改对应的值
print(new_dict, new_dict[5])
# items()key,value的元组的列表
print(new_dict.items(), new_dict.keys(), new_dict.values())
# items()返回的是一个元组列表, keys()返回的是键的列表,values()返回的值列表
for key, value in new_dict.items():
print(key, value)
# setdefault('7','d') 创建一个键,并且设置默认值
default_value = new_dict.setdefault(7, 'd')
print(new_dict)
# update() 可以将一个字典或者一个赋值表达式,或者一个元组列表合并到字典中
new_dict.update({8: 'a'})
new_dict.update(boby=3, boby2=4)
new_dict.update([(9, 'f'), (10, 'g')]) # 放一个元组列表
print(new_dict)
3.和字典相关的类
1. 当我们要自定义一个字典的时候,不要使用直接继承自dict,因为有些操作会不生效
# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 13:42'
class MyDict(dict):
def __setitem__(self, key, value):
super().__setitem__(key, value * 2)
my_dict = MyDict()
my_dict['a'] = 3 # 这个时候调用的是__setitem__方法
print(my_dict) # {'a': 6}
# 直接在构造函数中初始化字典,这个时候调用的应该是__call__方法
my_dict = MyDict(b=5)
print(my_dict) # {'b': 5}
# 所以最好不要继承dict的方式,可以用继承collections模块的UserDict的方式
2. 使用继承UserDict的方式来实现自定义的字典.
# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 13:47'
from collections import UserDict
class MyDict(UserDict):
def __setitem__(self, key, value):
super().__setitem__(key, value * 2)
mydict = MyDict(a=4)
print(mydict)
mydict['b'] = 5
print(mydict)
3. 创建带有默认值的字典. collections中的defaultdict
字典之所以可以实现带有默认值,其实是它内部实现了__missing__
方法,在UserDict类里面的__getitem__
方法中会调用__missing__
方法
def __getitem__(self, key):
if key in self.data:
return self.data[key]
if hasattr(self.__class__, "__missing__"):
return self.__class__.__missing__(self, key)
raise KeyError(key)
defaultdict之所以可以设置默认值就是因为实现了__missing__方法
4. set和frozenset
# encoding:utf-8
__author__ = 'Fioman'
__time__ = '2019/3/17 13:58'
# set 集合 frozenset(不可变集合),无序,不重复
s = set('abcdef')
print(s)
s1 = set(['a', 'b', 'c', 'd'])
print(s1)
# 通过大括号的方式直接赋值
s2 = {'a', 'b', 'c', 'd'}
print(s2)
# 1.集合可以添加元素
s2.add('f')
print(s2)
s = frozenset('abcde') # frozenset 是不可变的集合,可以作为字典的key
# s.add() 错误,不可变集合不能添加数据
# 2.clear() 清空集合
# 3.copy() 浅拷贝集合
# 4.pop() 弹出最后一个元素
# 5.remove() 删除一个集合元素
# 6.update()像set中添加一个集合
another_set = set('123')
s2.update(another_set)
print(s2)
# 7.difference(找不同)
ret_set = s2.difference(another_set) # s - s2
print(ret_set)
# 8.求交集 &
ret_set = s2 & another_set
print(ret_set)
# 9.求并集
ret_set = s2 | another_set
print(ret_set)
# 10 in 对应的魔法方法__contains__
if 'a' in ret_set:
pass
# 11. 判断是否是子集
if s2.issubset(another_set)
5. dict和set的实现原理
dict和list的性能对比:
1. dict的性能远远大于list
2. list的查找时间,hi随着list的数据的增多成正比例增加
3. 而dict的查找时间,不会随着字典的增大而增大.
字典的内部是通过hash表来映射的,什么是hash表,通过字典的key算出一个hash值,这个hash值对应一个位置,这个位置存放着字典的key和value.而因为hash表的存放是连续的,类似于数组,它查找和存取是根据偏移量来进行的,所以不需要遍历,就会速度很快.
注意:
set的值和字典的键的实现原理是一样的,都是可以hash的.
不可变对象,都是可hash的.str,forzenset,tuple,自己实现的类实现了__hash__
都是可hash的对象.都可以作为字典的键
dict的内存花销大,但是查询速度快,自定义对象,或者python的自定义对象,都是用字典的方式来存储的.
dict的存储顺序和元素的添加顺序有关
dict中添加元素的时候,有可能会改变原来的位置.当插入的数据过多,重新分配内存的时候,dict就有可能将原来的顺序打乱.
所以一般使用dict的时候,不要期望它会一直维持某种顺序.