以下主要是听极客时间:Python核心技术与实战时做的笔记
对于每一门编程语言,数据结构都是重中之重。对于Python而言,常见的有:列表、元祖、字典和集合。前面谈了列表和元组,这次来聊一聊字典和集合。
字典是由键(key)和值(value)配对组成的元素的集合。需要注意的是在 Python3.7+,字典被确定为有序。而集合和字典基本相同,唯一的区别是集合没有键值对,是无序的、唯一的元素的组合。
由于集合唯一性的特质,可以用它来做去重操作。
1.创建字典和元组
#字典的创建
d1 = {'name': 'Tom', 'age': 19, 'gender': 'male'}
d2 = dict({'name': 'Tom', 'age': 19, 'gender': 'male'})
d3 = dict([('name','Tom'), ('age', 19), ('gender','male')])
d4 = dict(name = 'Tom', age = 19, gender = 'male')
d1 == d2 == d3 == d4
True
常用第一种方式来构造字典,该法不需要借助函数因此更高效
#集合的创建
s1 = {1, 2, 3}
s2 = set([1, 2, 3])
s1 == s2
True
需要注意,Python 中字典和集合,无论是键还是值,都可以是混合类型,如:
s = {1, 'hello', 9.9}
s
{1, 9.9, 'hello'}
2.访问元素
#访问元素
dic = {'name': 'Tom', 'age': 19, 'gender': 'male'}
dic['name']
'Tom'
也可以使用get(key, default) 函数,如果键不存在,调用 get() 函数就会返回一个默认值,如下面的null
dic.get('name')
'Tom'
dic.get('location', 'null')
'null'
以上是字典的索引操作,而集合并不支持索引操作,例如
s = {1, 2, 3}
s[0]
TypeError: 'set' object does not support indexing
3.元素存在性判断
想要判断一个元素在不在字典或集合内,可以用 value in dict/set 来判断。
dic = {'name': 'Tom', 'age': 19, 'gender': 'male'}
'name' in dic
True
'location' in dic
False
s = {1, 2, 3}
1 in s
True
10 in s
False
4.字典和元组的修改
除了创建和访问外,字典和集合同样支持增加、删除、更新等操作。
#增加、删除、更新
d = {'name': 'Tom', 'age': 19}
d['gender'] = 'male' # 增加元素对'gender': 'male'
d
{'name': 'Tom', 'age': 19, 'gender': 'male'}
d['name'] = 'John' # 更新键'name'对应的值
d
{'name': 'John', 'age': 19, 'gender': 'male'}
d.pop('age') # 删除键为'dob'的元素对
d
{'name': 'John', 'gender': 'male'}
s = {1, 2, 3}
s.add(4) # 增加元素 4 到集合
s
{1, 2, 3, 4}
s.remove(4) # 从集合中删除元素 4
s
{1, 2, 3}
这里注意,集合的 pop() 操作是删除集合中最后一个元素,但集合是无序的,因此使用时应谨慎。
5.排序
对于排序,集合可以根据键也可以根据值来进行
#排序
d = {'b': 1, 'a': 2, 'c': 3}
d_sorted_by_key = sorted(d.items(), key = lambda x: x[0]) #根据字典的键升值排序
d_sorted_by_key
[('a', 2), ('b', 1), ('c', 3)]
d_sorted_by_value = sorted(d.items(), key = lambda x: x[1]) #根据字典的值升值排序
d_sorted_by_value
[('b', 1), ('a', 2), ('c', 3)]
集合的排序和前面的列表、元组类似,直接调用 sorted(set)即可。
s = {4, 6, 1, 3}
sorted(s)
[1, 3, 4, 6]
相比较列表和元组来说,字典和集合是性能高度优化的数据结构,特别是对于查找、添加和删除操作。
例如,我们的数据库里存储了每件产品的 ID、名称和价格。现在的需求是,给定某件商品的ID,找出其价格。用列表的方法,如果有n个元素,那么时间复杂度就为 O(n)
def find_product_price(products, product_id):
for id, price in products:
if id == product_id:
return price
return None
products = [
(143121312, 100),
(432314553, 30),
(32421912367, 150)
]
print('The price of product 432314553 is {}'.format(find_product_price(products, 432314553)))
# 输出
The price of product 432314553 is 30
此时,如果换用字典的方法,时间复杂度就降为O(1)
products = {
143121312: 100,
432314553: 30,
32421912367: 150
}
print('The price of product 432314553 is {}'.format(products[432314553]))
# 输出
The price of product 432314553 is 30
参考资料:
Python之集合详解