-
同时迭代多个序列
运用内置zip()
函数
zip(a, b) 会生成一个可返回元组 (x, y) 的迭代器,其中 x 来自 a, y 来自 b。一旦其中某个序列到结尾,迭代宣告结束。因此迭代长度跟参数中最短序列长度一致。
例如
>>> headers = ['name', 'shares', 'price','other']
>>> values = ['ACME', 100, 490.1]
>>> for name,value in zip(headers,values):
print(name,"=",value )
name = ACME
shares = 100
price = 490.1
>>>
上述迭代长度仅根参数最短序列长度一致,若需要与最长序列一致,可以使用 itertools.zip_longest()
函数来代替
上述例子可改写为:
>>> import itertools
>>> for name,value in itertools.zip_longest(headers,values):
print(name,"=",value )
name = ACME
shares = 100
price = 490.1
other = None
>>>
-
序列上索引值迭代
运用内置enumerate()
函数
enumerate() 函数返回的是一个 enumerate 对象实例,它是一个迭代器,返回连续的包含一个计数和一个值的元组,元组中的值通过在传入序列上调用 next() 返回,可指定一个开始的索引参数
示例1:
>>> values = ['ACME', 100, 490.1]
>>> for idx,val in enumerate(values,1):
print(idx,val)
1 ACME
2 100
3 490.1
>>> for idx,val in enumerate(values):
print(idx,val)
0 ACME
1 100
2 490.1
>>> data = [ (1, 2), (3, 4), (5, 6), (7, 8) ]
>>> for idx,val in enumerate(data):
print(idx,val)
0 (1, 2)
1 (3, 4)
2 (5, 6)
3 (7, 8)
>>>
示例2:统计文本文件单词出现的行号
# -*- coding: utf-8 -*-
from collections import defaultdict
work_sum=defaultdict(list)
with open("1.txt","r") as fp:
lines=fp.readlines()
for idx,val in enumerate(lines,1):
words=[w.lower() for w in val.split()]
for word in words:
work_sum[word].append(idx)
print(work_sum)
-
跳过可迭代对象的开始部分
仅仅跳过开始部分
使用itertools模块dropwhile()
函数,使用时,你给它传递一个函数对象和一个可迭代对象。它会返回一个迭代器对象,丢弃原有序列中直到函数返回 True 之前的所有元素。然后返回后面所有元素。
#过滤到#开头的
with open("1.txt","r") as fp:
for line in dropwhile(lambda line :line.startswith('#'), fp):
print(line)
值得注意的是,dropwhile()
函数仅仅是跳过满足条件的开始行