collections
是Python
内建的一个高性能容器数据类型,提供了许多有用的集合类。
-
namedtuple()
:生成可以使用名字来访问元素内容的tuple
子类 -
deque
: 双端队列,可以快速的从另外一侧追加和推出对象 -
Counter
: 计数器,主要用来计数 -
OrderedDict
: 有序字典 -
defaultdict
: 带有默认值的字典
Counter 计数器
- 列表重复元素的计数
In [3]: import collections
# 列表重复元素的计数
In [4]: c1 = collections.Counter('aaabbbsssdc')
In [5]: print c1
Counter({'a': 3, 's': 3, 'b': 3, 'c': 1, 'd': 1})
# 空的计数器
In [44]: c = collections.Counter()
In [45]: c
Out[45]: Counter()
# 通过映射关系生成的计数器
In [46]: c = collections.Counter({'red': 4, 'blue': 2})
In [47]: c
Out[47]: Counter({'blue': 2, 'red': 4})
# 通过关键字生成的计数器
In [48]: c = collections.Counter(cats=4, dogs=8)
In [49]: c
Out[49]: Counter({'cats': 4, 'dogs': 8})
-
most_common(n)
-- 列出最多的前n项
In [13]: c1.most_common(3)
Out[13]: [('a', 3), ('s', 3), ('b', 3)]
-
elements()
-- 以迭代器的方式取数据,如果某个元素的计数是负值,则忽略
# elements() -- 以迭代器的方式取数据,如果某个元素的计数是负值,则忽略
In [20]: c3 = collections.Counter(a=3, b=3, c=0, d=-2)
In [21]: c3.elements()
Out[21]: <itertools.chain at 0x109127610>
In [22]: list(c3.elements())
Out[22]: ['a', 'a', 'a', 'b', 'b', 'b']
-
subtract
-- 从可迭代或从另一映射(或计数器)中减去元素
# subtract -- 从可迭代或从另一映射(或计数器)中减去元素
In [25]: c = collections.Counter(a=4, b=2, c=0, d=-2)
In [26]: d = collections.Counter(a=1, b=2, c=3, d=4)
In [27]: c.subtract(d)
In [28]: c
Out[28]: Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})
-
update
-- 和subtract
相反,元素相加
# update -- 和 subtract 相反,元素相加
In [29]: c = collections.Counter(a=4, b=2, c=0, d=-2)
In [30]: d = collections.Counter(a=1, b=2, c=3, d=4)
In [31]: c.update(d)
In [32]: c
Out[32]: Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2})
-
clear
-- 清除
In [33]: c1
Out[33]: Counter({'a': 3, 'b': 3, 'c': 1, 'd': 1, 's': 3})
In [34]: c1.clear()
In [35]: c1
Out[35]: Counter()
- 字典重复Key的计数
# 字典重复Key的计数
In [8]: dic1 = {
...: 'a': 1,
...: 'b': 2,
...: 'a': 1,
...: 'a': 3}
In [10]: c2 = collections.Counter(dic1)
In [11]: print c2
Counter({'a': 3, 'b': 2})
In [12]: c2['a']
Out[12]: 3