python 集合

之前看到的列表和字符串都是一种有序序列,而集合 set 是一种无序的序列。

因为集合是无序的,所以当集合中存在两个同样的元素的时候,Python只会保存其中的一个(唯一性);同时为了确保其中不包含同样的元素,集合中放入的元素只能是不可变的对象(确定性)。

集合生成

a = set()
type(a)

也可以使用一个列表来初始化一个集合:

a = set([1, 2, 3, 1])
a

{1, 2, 3}
集合会自动去除重复元素 1。

可以看到,集合中的元素是用大括号{}包含起来的,这意味着可以用{}的形式来创建集合:

a = {1, 2, 3, 1}
a

{1, 2, 3}

但是创建空集合的时候只能用set来创建,因为在Python中{}创建的是一个空的字典:

s = {}
type(s)

dict

集合操作

假设有这样两个集合:

a = {1, 2, 3, 4}
b = {3, 4, 5, 6}

个集合的并,返回包含两个集合所有元素的集合(去除重复)。
可以用方法 a.union(b) 或者操作 a | b 实现。

a.union(b)
b.union(a)
a | b

结果都为{1, 2, 3, 4, 5, 6}

两个集合的交,返回包含两个集合共有元素的集合。
可以用方法 a.intersection(b) 或者操作 a & b 实现。

a.intersection(b)
b.intersection(a)
a & b

结果都为{3, 4}

print(a & b)

set([3, 4])
注意:一般使用print打印set的结果与表示方法并不一致。

a.difference(b)
a - b

结果都为{1, 2}

对称差

a 和b 的对称差集,返回在 a 或在 b 中,但是不同时在 a 和 b 中的元素组成的集合。
可以用方法 a.symmetric_difference(b) 或者操作 a ^ b 实现(异或操作符)。

a.symmetric_difference(b)
b.symmetric_difference(a)
a ^ b

{1, 2, 5, 6}

包含关系
a = {1, 2, 3}
b = {1, 2}

要判断 b 是不是 a 的子集,可以用 b.issubset(a) 方法,或者更简单的用操作 b <= a :

b.issubset(a)
b <= a

True
True

与之对应,也可以用 a.issuperset(b) 或者 a >= b 来判断:

a.issuperset(b)
a >= b

True
True

方法只能用来测试子集,但是操作符可以用来判断真子集:

a <= a

True

自己不是自己的真子集:

a < a

False

集合方法

add()向集合添加单个元素

跟列表的 append 方法类似,用来向集合添加单个元素。
s.add(a)
将元素 a 加入集合 s 中。

t = {1, 2, 3}
t.add(5)
t
t.add(3)                      #已有元素不改变
t

{1, 2, 3, 5}
{1, 2, 3, 5}

update 方法向集合添加多个元素

跟列表的extend方法类似,用来向集合添加多个元素。
s.update(seq)
将seq中的元素添加到s中。

t.update([5, 6, 7])
t

{1, 2, 3, 5, 6, 7}

remove 方法移除单个元素

s.remove(ob)
从集合s中移除元素ob,如果不存在会报错。

t.remove(1)
t

{2, 3, 5, 6, 7}

t.remove(10)

KeyError Traceback (most recent call last)
<ipython-input-31-3bc25c5e1ff4> in <module>()
----> 1 t.remove(10)

KeyError: 10

pop方法弹出元素

由于集合没有顺序,不能像列表一样按照位置弹出元素,所以pop 方法删除并返回集合中任意一个元素,如果集合中没有元素会报错。

t.pop()

{3, 5, 6, 7}

s = set()
# 报错
s.pop()

KeyError Traceback (most recent call last)
<ipython-input-34-9f9e06c962e6> in <module>()
1 s = set()
2 # 报错
----> 3 s.pop()

KeyError: 'pop from an empty set'

discard 方法

作用与 remove 一样,但是当元素在集合中不存在的时候不会报错。

t.discard(3)
t

{5, 6, 7}
不存在的元素不会报错:

t.discard(20)
t

{5, 6, 7}

difference_update方法

a.difference_update(b)
从a中去除所有属于b的元素:

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 最近在写个性化推荐的论文,经常用到Python来处理数据,被pandas和numpy中的数据选取和索引问题绕的比较...
    shuhanrainbow阅读 10,042评论 6 19
  • 背景 一年多以前我在知乎上答了有关LeetCode的问题, 分享了一些自己做题目的经验。 张土汪:刷leetcod...
    土汪阅读 14,354评论 0 33
  • set是什么?括号和字典一样,但是元素和列表一样,但它也有自己的好处 set拥有类似dict的特点: 可以用{}花...
    布拉豆阅读 6,190评论 1 0
  • 1.set集合 可变集合(set):可添加和删除元素,非可哈希的,不能用作字典的键,也不能做其他集合的元素 不可变...
    lmem阅读 12,451评论 0 0
  • 年华老去,爱仍在当你老了, 头发白了,睡意昏沉, 炉火旁打盹, 请取下这部诗歌, 慢慢读, 回想你过去眼神的柔和,...
    张怼怼阅读 1,657评论 0 1

友情链接更多精彩内容