Python合并两个字典成一个新字典的几种方法分析比较
两个字典如下:
>>> d1 = {'name' : 'revotu', 'age' : 99}
>>> d2 = {'age' : 24, 'sex' : 'male'}
合并后的结果如下(即,key相同时后面字典值覆盖前面字典):
>>> d
{'sex': 'male', 'name': 'revotu', 'age': 24}
首先,说明字典并不支持+加法运算:
>>> d1 + d2
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for +: 'dict' and 'dict'
>>>
现总结如下几种方法以及简要分析比较。
- 多次更新
下面是最简单的合并字典的方式:
>>> d = {}
>>> d.update(d1)
>>> d.update(d2)
首先创建一个空字典,并使用update方法向字典中添加元素。注意,先添加的是d1,以保证后面添加的d2重复键会覆盖d1。
此方法满足了我们的要求,而且清晰明确,可是三行代码总感觉不够Pythonic。
- 先复制,后更新
先复制d1字典创建一个新字典,然后使用d2来更新前面创建的新字典。
>>> d = d1.copy()
>>> d.update(d2)
对比方法一,这种复制d1的方法,更明显的表现出d1作为默认值。
- 字典构造器
还可以使用字典的构造器dict()复制字典,然后再更新:
>>> d = dict(d1)
>>> d.update(d2)
与方法二很相似,但是没有方法二直接明了。
- 关键字参数hack
你可能见过下面这个巧妙的解决办法:
>>> d = dict(d1 , **d2)
只有一行代码,看上去很酷,但是有一个问题,这种hack技巧只有在字典的键是字符串时才有效。
看上去很cool,但是不通用,字典的键必须是字符串才可以用这种关键字参数方法。
- 字典推导式
可以用字典推导式解决此问题:
>>> d = {k:v for d in [d1, d2] for k,v in d.items()}
字典推导式方法满足要求,只是嵌套的字典推导式,不那么清晰,不易于理解。
- 元素拼接
我们从每个字典中获取一个元素列表,将列表拼接起来,然后再用拼接的列表构造字典:
>>> d = dict(list(d1.items()) + list(d2.items()))
而且,d2的元素在列表后面,所以在键重复时可以覆盖d1。如果在Python2中,items()方法本身返回的就是列表,无需用list()转成列表。
元素拼接在构造字典可以满足要求,只是看上去代码有些重复。
- 元素并集
在Python3中,字典返回的是视图对象,键的视图对象是一个类似集合的对象,如果字典中的值可以保证是唯一的可哈希的,此时items返回的视图对象也是一个类似集合的对象:
>>> d = dict(d1.items() | d2.items())
这种方法挺有意思,可是并不准确,因为集合是无序的,键重复时不能保证谁覆盖谁,而且字典中的值通常也是不可哈希的,当然也就不能返回一个类似集合的对象。
- chain items
目前为止,我们讨论的解决方案中,最符合Python语言习惯而且只有一行代码实现的,是创建两个items的列表,然后拼接成字典。
我们可以用itertools.chain来简化items拼接过程:
>>> d = dict(chain(d1.items(), d2.items()))
这种方案很不错,可能比另外创建两个不必要的列表更高效。
- ChainMap
collections.ChainMap可以将多个字典或映射,在逻辑上将它们合并为一个单独的映射结构:
>>> d = dict(ChainMap(d1, d2))
这种方法也很pythonic,而且也是通用方法。
- 字典拆分
在Python3.5+中,可以使用一种全新的字典合并方式:
>>> d = {**d1, **d2}
这行代码很pythonic,如果是你的python版本是3.5+,用这种方法是很不错的选择。
总结
上面说了十种可以合并两个字典成一个新字典的方式,具体用哪个取决于你。
如果使用的是Python3.5+的版本,那么字典拆分这种新语法应该很适合你:
>>> d = {**d1, **d2}