17_集合(set)


时间:2018-11-05 作者:魏文应


一、集合

集合和列表相似,不同点在于:

  • 集合中只能存储不可变对象。
  • 集合中存储的对象时无序(不是按照元素的插入顺序保存)。
  • 集合中不能出现重复的元素。

创建集合

通过大括号 { } 创建集合:

s = {10, 2, 2, 2, 2, 2}
print(s, type(s))

上面,相同的集合元素 2 会被去掉,只保留一个 2,打印结果如下:

{10, 2} <class 'set'>

集合中,是不能有可变对象的,比如,下面写法会报错:

s = {[1, 2, 3], [4, 5, 6]}  # TypeError: unhashable type: 'list'

还可以通过 set() 方法创建一个集合:

s = set()  # 创建了一个空集合
s = set([1, 2, 3, 2, 3, 5])  # 列表转换为集合
print(s)
s = set('hello')  # 字符串转换为集合
print(s)
s = set({'a': 1, 'b': 2})  # 使用set()将字典转换为集合时,只保留了键,值会被去掉
print(s)

上面代码,打印结果如下:

{1, 2, 3, 5}
{'h', 'o', 'l', 'e'}
{'b', 'a'}

集合是 无序的,无法直接索引:

s = {'b', 'a', 1, 2, 30}
print(s, type(s))
# print(s[0]) # 集合时无序的,不能这样直接索引
print(list(s)[0])    # 可以先通过list转换为列表,再索引,但用处不大

二、集合相关操作

检查元素

可以使用 in 或者 not in 关键字来检查集合中元素存在情况。例如:

s = {'b', 'a', 1, 2, 30}
print('c' in s)
print('c' not in s)

字符 c 不在集合 s中,返回 FalseTrue ,打印结果如下:

False
True

添加元素(add)

通过 add() 方法向一个集合中添加元素:

s = {1, 2, 7}
s.add(4)
print(s)

上面代码,打印结果如下:

{1, 2, 4, 7}

添加集合(update)

可以使用 update() 方法,将一个集合中的元素添加到当前集合中。例如:

s1 = set('hello')
s2 = set([1, 2, 3, 4])
s1.update(s2)
print(s1)

上面,将 s2 中的元素添加到了 s1 中,打印结果如下:

{1, 'l', 'e', 2, 3, 4, 'o', 'h'}

随机删除元素(pop)

可以使用 pop() 方法,随机删除集合中的一个元素,并返回被删除的元素:

s = {1, 2, 3, 4}
result = s.pop()
print(result)
print(s)

如果集合为空,程序会抛出异常。上面代码打印结果如下:

1
{2, 3, 4}

删除指定元素(remove)

使用 remove() 方法,删除集合中指定的元素:

s = {1, 2, 3, 4}
s.remove(2)
print(s)

只能删除集合里面有的元素,否则会抛出异常。打印结果如下:

{1, 3, 4}

三、集合数学运算

数学上,我们可以对集合进行运算。

交集运算

使用符号 & ,进行交集运算:

s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 & s2
print(result)

交集运算,不会影响 s1 和 s2 原来的值。打印结果如下:

{3, 4}

并集运算

可以使用符号 | 进行并集计算:

s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 | s2
print(result)

打印结果如下:

{1, 2, 3, 4, 5, 6}

差集运算

可以使用符号 - 进行差集运算:

s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 - s2
print(result)

上面,计算得到了,只在 s1 中有,在 s2 中没有的元素,打印结果如下:

{1, 2}

异或集运算

去掉两个集合中都有的元素,称为异或集运算 :

s1 = {1, 2, 3, 4}
s2 = {3, 4, 5, 6}
result = s1 ^ s2
print(result)

上面代码中,打印结果中,不包含两个集合中相同的元素(也就是交集部分的元素):

{1, 2, 5, 6}

子集检查

首先,要理解这么一个数学概念:

如果a集合中的元素全部都在b集合中出现,那么这个b集合就是a集合的子集,b集合是a集合的超集。

使用符号 <= ,检查一个集合是否是另一个集合的子集:

s1 = {1, 2, 3}
s2 = {1, 2, 3, 4, 5, 6}
print(s1 <= s2)

上面打印结果如下:

True

使用符号 >= ,检查一个集合是否是另一个集合的超集:

s2 = {1, 2, 3, 4, 5, 6}
s1 = {1, 2, 3}
print(s1 >= s2)

上面打印结果如下:

True

数学上:

如果超集b中含有子集a中的所有元素,并且b中还有a中没有的元素,则b就是a的真超集,a 是 b 的真子集。

使用符号 < 检查真超集,> 检查是否是真子集。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容