Python字典和集合

字典和集合的定义

字典:字典是由一系列键(key)和值(value)配对组成的元素的集合
集合:和字典基本相同,唯一的区别在于集合没有键和值得配对,它是由一系列无序的、唯一的元素组合。

字典和集合的创建

>>> d1 = {'name': 'jason', 'age': 20, 'gender': 'male'}
>>> d2 = dict({'name': 'jason', 'age': 20, 'gender': 'male'})
>>> d3 = dict(name='jason', age=20, gender='male')
>>> d4 = dict([('name','jason'),('age', 20), ('gender', 'male')])
>>> d1 == d2 == d3 == d4
True

>>> s1 = {1,2,3}
>>> s2 = set([1,2,3])
>>> s1 == s2
True

字典和集合的访问

>>> d = {'name': 'jason', 'age': 20}
>>> d['name']
'jason'
>>> d['location']
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'location'

>>> d = {'name': 'jason', 'age': 20}
>>> d.get('name')
'jason'
>>> d.get('location', 'null')
'null'

# 集合并不支持索引,因为集合本质上是一个哈希表,和列表不一样
>>> s = {1,2,3}
>>> s[0]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'set' object does not support indexing

>>> s = {1,2,3}
>>> 1 in s
True
>>> 10 in s
False
>>> d = {'name': 'jason', 'age': 20}
>>> 'name' in d
True
>>> 'location' in d
False

字典和集合的增加、删除以及更新操作

>>> d = {'name': 'jason', 'age': 20}
>>> d['gender'] = 'male'  # 增加元素对'gender'
>>> d['dob'] = '1999-02-01' # 增加元素对'dob'
>>> d
{'name': 'jason', 'age': 20, 'gender': 'male', 'dob': '1999-02-01'}
>>> d.pop('dob') # 删除键为'dob'的元素
'1999-02-01'
>>> d
{'name': 'jason', 'age': 20, 'gender': 'male'}

>>> s = {1,2,3}
>>> s.add(4) # 增加元素4到集合
>>> s
{1, 2, 3, 4}
>>> s.remove(4) #从集合中删除元素4
>>> s
{1, 2, 3}

字典和集合的排序

>>> d = {'b':1, 'a':2, 'c':10}
>>> d
{'b': 1, 'a': 2, 'c': 10}
>>> d_sorted_by_key = sorted(d.items(), key=lambda x: x[0])
>>> d_sorted_by_value = sorted(d.items(), key=lambda x: x[1])
>>> d_sorted_by_key
[('a', 2), ('b', 1), ('c', 10)]
>>> d_sorted_by_value
[('b', 1), ('a', 2), ('c', 10)]

>>> s = {3,4,2,1}
>>> sorted(s)
[1, 2, 3, 4]

字典和集合的性能比较

# cat time_test.py 
import time

# list version
def find_unique_price_using_list(products):
    unique_price_list = []
    for _, price in products: # A
        if price not in unique_price_list: #B
            unique_price_list.append(price)
    return len(unique_price_list)

    
# set version
def find_unique_price_using_set(products):
    unique_price_set = set()
    for _, price in products:
        unique_price_set.add(price)
    return len(unique_price_set)

products = [
    (143121312, 100), 
    (432314553, 30),
    (32421912367, 150),
    (937153201, 30)
]

start_using_list = time.perf_counter()
find_unique_price_using_list(products)
end_using_list = time.perf_counter()
print("time elapse using list: {}".format(end_using_list - start_using_list))


# 计算集合版本的时间
start_using_set = time.perf_counter()
find_unique_price_using_set(products)
end_using_set = time.perf_counter()
print("time elapse using set: {}".format(end_using_set - start_using_set))
# python time_test.py 
time elapse using list: 3.7122517824172974e-06
time elapse using set: 3.2670795917510986e-06

字典和集合的工作原理

字典和集合内部都是一张哈希表

  • 字典里面,这张表里面存储了哈希值,键以及值这三个元素
  • 对集合而言,里面没有键值得配置,只有单一的元素
  • 对于插入操作,会首先计算键的哈希值,在得到一个mask = PyDicMinSize - 1,来确定这个元素应该插入哈希表的位置index = hash(key) & mask。如果哈希表中这个位置是空的,那这个元素就被插入。
    如果此位置已经被占用,python会比较两个元素的哈希值和键是否相等。
    如果二者都相等,说明元素已经存在,如果值不相等,则更新值。
    如果二者其中有一个不相等,我们称为哈希冲突(hash collsion),也就是两个元素的键不相等,但是哈希值相等。这种情况下,python会继续寻找表中空余位置,直到找到位置为止。
  • 对于查找操作,和插入操作类似,python会根据哈希值,找到其对应位置;然后比较这个位置中元素的哈希值和键,和需要查找的元素是否相等。如果相等,返回;如果不等,继续查找,直到找到空位或者抛出异常为止。
    对于删除操作,python会暂时对这个位置的元素赋予一个特殊值,等到重新调整哈希表的时候,再做删除。
  • 出现哈希冲突就会降低字典和集合的操作速度。所以为了保证高效性,它们内部的哈希表通常会至少保留1/3的剩余空间。当元素不停插入,剩余空间小鱼1/3时,python会获得更大的内存空间,扩充哈希表。在这种情况下,表内所有的元素都会被重新排放。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容

  • 1.1.字典 1.1.1.字典定义 字典是包含若干“键:值”元素的无序可变序列,字典中的每个元素包含“键”和“值”...
    Rolle_Wang阅读 977评论 0 0
  • 一、复习(列表) 1.容器,可以同时存放多个数据。可变,有序2.元素,可以是任何类型的数据,一个列表可以同时存放不...
    Sakura_flower阅读 527评论 0 7
  • 1 字典基础操作 1.1 创建字典 通过{}操作符创建字典aDict = {'name':'ke', 'age':...
    Ke爺阅读 580评论 0 0
  • 回到洗脑的角度,基因在很大程度上对一个人的抗洗脑能力有致命影响。相比而言,华人总是很难被洗脑,他们既依赖权威,同时...
    君为jw阅读 281评论 0 0
  • 有你 有家 安静 昏暗 狭小的房间 关门 开灯 没闻到油烟 椅子 桌上 衣服和速食 左手 右手 耳机与手机 耳旁...
    陈小护阅读 198评论 1 0