在数学上,我们把由不同的元素组成的容器叫做集合。Python引入了这一概念,集合对象是一组无序排列的可哈希的值。在Python中,集合有两种不同的类型:可变集合(set)和不可变集合(frozenset)。
集合(set)
在数学上,我们把由不同的元素组成的容器叫做集合。Python引入了这一概念,集合对象是一组无序排列的可哈希的值。在Python中,集合有两种不同的类型:可变集合(set)和不可变集合(frozenset)。对于可变集合来说,像列表一样可以删除和添加元素,对于不可变集合来说,则不允许这样做。
集合的创建
集合可以通过set()方法和frozenset()方法来创建。
>>> set('language')
set(['a', 'e', 'g', 'l', 'n', 'u'])
>>> frozenset('Chinese')
frozenset(['C', 'e', 'i', 'h', 'n', 's'])
集合的访问
可以通过遍历的方法来访问。无法像序列或者字典那样单一地访问某一元素。
>>> for i in set('language'):
print i,
a e g l n u
集合的更新
只有可变集合才可以添加或删除集合的成员,不可变集合无法执行。
>>> set1 = set('language')
>>> set1.add('d')
>>> set1
set(['a', 'e', 'd', 'g', 'l', 'n', 'u'])
>>> set1.remove('d')
>>> set1
set(['a', 'e', 'g', 'l', 'n', 'u'])
>>> set1.update('hello')
>>> set1
set(['a', 'e', 'g', 'h', 'l', 'o', 'n', 'u'])
集合类型操作符
类似in/not in 、>、<等操作符同样地适合集合。
联合(|)
联合操作等价于集合的or。两个集合的联合是一个新集合,该集合中的每个元素至少是其中一个集合的成员。
>>> set1 = set('language')
>>> set2 = set('Chinese')
>>> set3 = set1 | set2
>>> set3
set(['a', 'C', 'e', 'g', 'i', 'h', 'l', 'n', 's', 'u'])
交集(&)
交集操作等价于集合的and。两个集合的交集是一个新集合,该集合中的每一个元素同时是两个集合的成员。
>>> set4 = set1 & set2
>>> set4
set(['e', 'n'])
差补(-)
两个集合的差补是指一个集合C,只属于集合S,而不属于集合T。
>>> set5 = set1 - set2
>>> set5
set(['a', 'u', 'l', 'g'])
对称差分(^)
对称差分等价于集合的XOR(异或),两个集合的对称差分是一个新集合,该集合中的成员只能属于集合S或者集合T,不能同时属于两个集合。
>>> set6 = set1 ^ set2
>>> set6
set(['a', 'C', 'l', 'u', 'g', 'i', 'h', 's'])
混合集合
如果操作符左边的集合属于可变集合,操作符右边的集合属于不可变集合,经过任意操作符运算后,得到的新集合类型和左边的集合类型保持一致。
>>> set1 = set('language')
>>> set2 = frozenset('Chinese')
>>> set3 = set1 ^ set2
>>> type(set3)
<type 'set'>
>>> set4 = set2 - set1
>>> type(set4)
<type 'frozenset'>