itertools模块提供了许多迭代器相关的接口,可对迭代器进行生成、访问、赋值、合并等各种操作。本文对itertools模块较实用的一些接口进行讨论。
1 product
product是itertools模块最实用的接口之一,其接受任意数量的多个可迭代对象作为参数,返回这些对象的笛卡尔积迭代器。此接口常用于多组参数相互组合的枚举遍历:
for i, j in itertools.product([1, 2, 3],[4, 5]):
print(i, j)
2 izip、imap、ifilter
分别是Python的zip、map、filter函数的迭代器返回值版本。这三个函数在Python3已被弃用。
3 zip_longest
zip、izip函数在处理多个可迭代对象时,如果各序列长度不一致,则zip会截断较长序列末尾多出的部分,从而生成与最短序列的长度一致的返回值。而zip_ longest函数的行为与zip相反,其会补全多个序列中较短序列的末尾,从而返回与多个序列中最长序列的长度一致的返回值。zip_longest的参数与zip一致,也接受多个不定长参数,而其通过fillvalue关键字参数指定补全时使用的值:
for i, j in itertools.zip_longest([1, 2,3], [4, 5], fillvalue = None):
print(i, j)
4 dropwhile
dropwhile用于在使用一个迭代器之前消耗部分迭代器,常用于文件句柄。其接受两个参数,第一参数为一个lambda表达式或函数名,用于跳过满足此条件的元素,第二参数为一个可迭代对象,此函数返回一个已经被消耗的迭代器:
for i in itertools.dropwhile(lambda x: x< 5, range(10)):
print(i)
5 cycle
cycle为一个无限迭代器,一般只能通过next函数进行有限次迭代。其接受一个可迭代对象作为参数,返回一个可以不断从左到右循环访问的无限迭代器:
numIter = itertools.cycle([1, 2])
for i in range(5):
print(next(numIter))
2018年6月于苏州