5.1 什么是集合(set)?
集合(set)是一个无序的不重复元素序列。
5.2 集合的创建
- 定义一个集合,将元素用
{}
扩起来。
example_set = {'basketball', 'volleyball', 'football'}
输出结果如下:
{'volleyball', 'football', 'basketball'}
- 利用set()命令来创建集合
example_set = set('asdfghjkl')
输出结果如下:
{'l', 's', 'g', 'k', 'd', 'f', 'a', 'j', 'h'}
从上面的定义中我们可以看出,定义好的集合输出后元素都进行了重新排列。这也正是体现了集合无序的特征。
5.3 集合的基本操作
5.3.1 集合元素的去重
从定义上可以看出,集合(set)是一种无序不重复的序列,那么我们在定义一个集合的过程中,如果该集合中重复出现了某个或者某些元素,该集合在输出的时候,将只保留一个该元素,而会将多余重复的元素删除。
例如:
example_set3 = {'basketball', 'volleyball', 'football', 'baseball', 'volleyball'}
print(example_set3)
输出结果为:
{'basketball', 'football', 'baseball', 'volleyball'}
5.3.2 集合基本运算
通过下面这个例子来说明一下集合的元素间的基本运算:
set_a = set('abhduagejqedgd')
set_b = set('dihengahe')
print(set_a - set_b)
print(set_a | set_b)
print(set_a & set_b)
print(set_a ^ set_b)
输出结果如下:
{'j', 'u', 'q', 'b'}
{'b', 'h', 'a', 'u', 'q', 'd', 'n', 'i', 'g', 'j', 'e'}
{'h', 'a', 'd', 'g', 'e'}
{'b', 'u', 'q', 'n', 'i', 'j'}
set_a - set_b:
集合set_a
中包含而集合set_b
中不包含,换句话说就是集合set_a
减去与set_b
中重复的元素,剩余的元素,需要注意的是,如果集合set_b
中有set_a
中没有的元素,这个相减的结果是不包括这些元素的。
set_a | set_b:
集合set_a
和集合set_b
中包含的所有元素,相当于两个集合的并集。
set_a & set_b:
集合set_a
和集合set_b
中共同包含的元素,相当于两个集合的交集。
set_a ^ set_b:
集合set_a
和集合set_b
中不同时包含的元素,可以理解为并集减去交集剩余的部分。
5.3.3 向集合中添加元素
向集合中添加元素有两种方法,一种是set.add(object),一种是set.update()。
区别是,前者是将单个元素添加到集合中,如果集合中本身存在这个元素,则根据不重复原则,将不改变已有内容;后者向集合中添加元素不限于单个元素,也可以是列表、元组、字典等。
5.3.4 从集合中删除元素
从集合中删除元素共有三种方法:
set.remove(object)
set.dicard(object)
set.pop()
前两种都是对集合中指定元素的删除,如果元素存在于集合中,效果是一样的。如果要删除的元素不存在于集合中,remove方法就会报错,而discard方法则不会报错。
pop方法则是随机删除集合中的一个元素。
增加和删除元素参考以下例题:
example_set1.add('tennis')
example_set2.update( [2, 4, 6], {'name': 'Lily', 'number': 12, 'score': 88})
print(example_set1)
print(example_set2)
set_a.remove('d')
set_b.discard('e')
example_set3.pop()
print(set_a)
print(set_b)
print(example_set3)
输出结果如下:
{'volleyball', 'basketball', 'football', 'tennis'}
{'score', 2, 'f', 4, 'a', 6, 'd', 'g', 'l', 'number', 's', 'name', 'h', 'j', 'k'}
{'b', 'u', 'a', 'q', 'g', 'h', 'j', 'e'}
{'i', 'a', 'd', 'g', 'n', 'h'}
{'basketball', 'football', 'baseball'}
需要注意的一点是,通过测试发现,利用update方法往集合中增加元素的时候,整数或者整型是不被允许的,会报错。此外,字典虽然可以被添加,但是只是把键添加进去了,而值则被忽略掉了。
5.3.5 其他
len(set)
:计算集合的元素个数
set.clear()
:情况集合
object in set
:判断元素object是否在集合set中,如果是,返回True,如果不是,返回False。
5.4 集合的一些内置函数
前面已经提到了一部分,诸如set.add(object)
,set.update()
,set_remove(object)
,set.discard(object)
等等。其余的一些内置函数在具体使用的过程中再慢慢探索和体会。
5.5 小结
这一小节主要学习了集合(set)这种数据类型的基本概念和使用方法,对于这种无序不重复的数据类型具体怎样使用还需要进一步学习。