python-集合2018-09-26


py集合介绍

python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.

集合特点

sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。

集合运算

x = set('spam')
y = set(['h','a','m'])
print(x,y)
print('交集 = ', x & y)
print('交集 = ', x | y)
print('x-y差集 = ', x - y)
print('y-x差集 = ', y - x)

记得以前个网友提问怎么去除海量列表里重复元素,用hash来解决也行,只不过感觉在性能上不是很高,用set解决还是很不错的

a = [11,22,33,44,11,22]
b = set(a)
print(b)

集合定义

集合用于包含一组无序的对象。要创建集合,可使用set()函数

s = set([3,5,9,10])      #创建一个数值集合
t = set("Hello")         #创建一个唯一字符的集合

与列表和元组不同,集合是无序的,也无法通过数字进行索引。此外,集合中的元素不能重复。例如,如果检查前面代码中t集合的值,结果会是:

print('集合t=',t)  #注意只出现了一个'l'
a = t | s          # t 和 s的并集
b = t & s          # t 和 s的交集
c = t - s          # 求差集(项在t中,但不在s中)
d = t ^ s          # 对称差集(项在t或s中,但不会同时出现在二者中)

基本操作

元素长度len

print(len(s))

添加元素 add

向 set “s”中增加元素 x,x不能是set,dist,list类型

t.add('x')            # 添加一项
s.update([10,37,42])    # 在s中添加多项
print('集合添加测试:t=',t,'集合s',s)

删除元素 remove

从 set “s”中删除元素 x, 如果不存在则引发 KeyError

s.remove(x)
print(s)

删除discard

如果在 set “s”中存在元素 x, 则删除,如果不存在,也不报错
s.discard('c')
print(s)

删除pop

删除并且返回 set “s”中的一个不确定的元素, 如果为空则引发 KeyError

print(s.pop())
print(s)

删除clear

删除 set “s”中的所有元素

s.clear()
print(s)

成员判断in,not in

测试 x 是否是 s 的成员
print(x in s)
测试 x 是否不是 s 的成员
print(x not in s)
测试是否 s 中的每一个元素都在 t 中
print(s.issubset(t))
print(s <= t)
测试是否 t 中的每一个元素都在 s 中
print(s.issuperset(t))
print(s >= t)

合集,并集

返回一个新的 set 包含 s 和 t 中的每一个元素
print(s.union(t))
print(s | t)

交集

返回一个新的 set 包含 s 和 t 中的公共元素
s.intersection(t)
s & t

差集

返回一个新的 set 包含 s 中有但是 t 中没有的元素
s.difference(t)
s - t

对称差集

返回一个新的 set 包含 s 和 t 中不重复的元素
s.symmetric_difference(t)
s ^ t

集合复制

返回 set “s”的一个浅复制
print(s.copy())

请注意:union(), intersection(), difference() 和 symmetric_difference() 的非运算符(non-operator,就是形如 s.union()这样的)版本将会接受任何 iterable 作为参数。相反,它们的运算符版本(operator based counterparts)要求参数必须是 sets。这样可以避免潜在的错误,如:为了更可读而使用 set('abc') & 'cbs' 来替代 set('abc').intersection('cbs')。从 2.3.1 版本中做的更改:以前所有参数都必须是 sets。

另外,Set 和 ImmutableSet 两者都支持 set 与 set 之间的比较。两个 sets 在也只有在这种情况下是相等的:每一个 set 中的元素都是另一个中的元素(二者互为subset)。一个 set 比另一个 set 小,只有在第一个 set 是第二个 set 的 subset 时(是一个 subset,但是并不相等)。一个 set 比另一个 set 打,只有在第一个 set 是第二个 set 的 superset 时(是一个 superset,但是并不相等)。

子 set 和相等比较并不产生完整的排序功能。例如:任意两个 sets 都不相等也不互为子 set,因此以下的运算都会返回 False:a<b, a==b, 或者a>b。因此,sets 不提供 cmp 方法。
因为 sets 只定义了部分排序功能(subset 关系),list.sort() 方法的输出对于 sets 的列表没有定义。

运算实例

update

集合update方法:是把要传入的元素拆分,做为个体传入到集合中

# print('集合update')
# print(s,t)
# s.update(t)
# s |= t
# print(s)

intersection_update

集合s保留含有 set “t”中元素的 set “s”
集合s 保留集合 t与集合s的交集

# s.intersection_update(t)
# s &= t
# print(s)

difference_update

集合s保留删除了 set “t”中含有的元素后的 set “s”

# s.difference_update(t)
#s -= t
# print(s)

symmetric_difference_update

集合s保留含有 set “t”或者 set “s”中有而不是两者都有的元素的 set “s”

# s.symmetric_difference_update(t)
# s ^= t
# print(s)

请注意:非运算符版本的 update(), intersection_update(), difference_update()和symmetric_difference_update()将会接受任意 iterable 作为参数。从 2.3.1 版本做的更改:以前所有参数都必须是 sets。
还请注意:这个模块还包含一个 union_update() 方法,它是 update() 方法的一个别名。包含这个方法是为了向后兼容。程序员们应该多使用 update() 方法,因为这个方法也被内置的 set() 和 frozenset() 类型支持。

参考:https://blog.csdn.net/business122/article/details/7541486

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • //Clojure入门教程: Clojure – Functional Programming for the J...
    葡萄喃喃呓语阅读 3,779评论 0 7
  • 《游子吟》——孟郊对伟大母爱歌颂的诗篇,千百年来家喻户晓。孟郊是在怎样的情境下写下了这样的千古名篇呢?今日诗歌赏读...
    萃辰天心书院阅读 1,635评论 0 2
  • 2016对于我真的是跌跌撞撞的一年,走过许多路,遇到许多事。惊喜过,彷徨过,失落过。甚至一度觉得,这一年对于我的意...
    虚音阅读 153评论 0 0
  • 严小辉和苏小黎成了好朋友,似乎都可以成为好基友了 有一次,苏小黎打篮球赛,我跑去给他加油带了瓶水,苏小黎微红的脸,...
    简天才阅读 277评论 0 1
  • 正式入职后,小晓慢慢了解了公司的大概构成:帅帅的经理大叔,不过35岁,婚姻稳定,工厂资深深深业务员,后来在工厂自...
    MsElaine阅读 257评论 0 0