时间:2018-11-05
作者:魏文应
一、集合
集合和列表相似,不同点在于:
- 集合中只能存储不可变对象。
- 集合中存储的对象时无序(不是按照元素的插入顺序保存)。
- 集合中不能出现重复的元素。
创建集合
通过大括号 { }
创建集合:
s = {10, 2, 2, 2, 2, 2}
print(s, type(s))
上面,相同的集合元素 2
会被去掉,只保留一个 2
,打印结果如下:
{10, 2} <class 'set'>
集合中,是不能有可变对象的,比如,下面写法会报错:
s = {[1, 2, 3], [4, 5, 6]} # TypeError: unhashable type: 'list'
还可以通过 set()
方法创建一个集合:
s = set() # 创建了一个空集合
s = set([1, 2, 3, 2, 3, 5]) # 列表转换为集合
print(s)
s = set('hello') # 字符串转换为集合
print(s)
s = set({'a': 1, 'b': 2}) # 使用set()将字典转换为集合时,只保留了键,值会被去掉
print(s)
上面代码,打印结果如下:
{1, 2, 3, 5}
{'h', 'o', 'l', 'e'}
{'b', 'a'}
集合是 无序的,无法直接索引:
s = {'b', 'a', 1, 2, 30}
print(s, type(s))
# print(s[0]) # 集合时无序的,不能这样直接索引
print(list(s)[0]) # 可以先通过list转换为列表,再索引,但用处不大
二、集合相关操作
检查元素
可以使用 in
或者 not in
关键字来检查集合中元素存在情况。例如:
s = {'b', 'a', 1, 2, 30}
print('c' in s)
print('c' not in s)
字符 c
不在集合 s
中,返回 False
和 True
,打印结果如下:
False
True
添加元素(add)
通过 add()
方法向一个集合中添加元素:
s = {1, 2, 7}
s.add(4)
print(s)
上面代码,打印结果如下:
{1, 2, 4, 7}
添加集合(update)
可以使用 update()
方法,将一个集合中的元素添加到当前集合中。例如:
s1 = set('hello')
s2 = set([1, 2, 3, 4])
s1.update(s2)
print(s1)
上面,将 s2 中的元素添加到了 s1 中,打印结果如下:
{1, 'l', 'e', 2, 3, 4, 'o', 'h'}
随机删除元素(pop)
可以使用 pop()
方法,随机删除集合中的一个元素,并返回被删除的元素:
s = {1, 2, 3, 4}
result = s.pop()
print(result)
print(s)
如果集合为空,程序会抛出异常。上面代码打印结果如下:
1
{2, 3, 4}
删除指定元素(remove)
使用 remove()
方法,删除集合中指定的元素:
s = {1, 2, 3, 4}
s.remove(2)
print(s)
只能删除集合里面有的元素,否则会抛出异常。打印结果如下:
{1, 3, 4}
三、集合数学运算
数学上,我们可以对集合进行运算。
交集运算
使用符号 &
,进行交集运算:
s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 & s2
print(result)
交集运算,不会影响 s1 和 s2 原来的值。打印结果如下:
{3, 4}
并集运算
可以使用符号 |
进行并集计算:
s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 | s2
print(result)
打印结果如下:
{1, 2, 3, 4, 5, 6}
差集运算
可以使用符号 -
进行差集运算:
s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 - s2
print(result)
上面,计算得到了,只在 s1 中有,在 s2 中没有的元素,打印结果如下:
{1, 2}
异或集运算
去掉两个集合中都有的元素,称为异或集运算 :
s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 ^ s2
print(result)
上面代码中,打印结果中,不包含两个集合中相同的元素(也就是交集部分的元素):
{1, 2, 5, 6}
子集检查
首先,要理解这么一个数学概念:
如果a集合中的元素全部都在b集合中出现,那么这个b集合就是a集合的子集,b集合是a集合的超集。
使用符号 <=
,检查一个集合是否是另一个集合的子集:
s1 = {1, 2, 3}
s2 = {1, 2, 3, 4, 5, 6}
print(s1 <= s2)
上面打印结果如下:
True
使用符号 >=
,检查一个集合是否是另一个集合的超集:
s2 = {1, 2, 3, 4, 5, 6}
s1 = {1, 2, 3}
print(s1 >= s2)
上面打印结果如下:
True
数学上:
如果超集b中含有子集a中的所有元素,并且b中还有a中没有的元素,则b就是a的真超集,a 是 b 的真子集。
使用符号 <
检查真超集,>
检查是否是真子集。