Python迭代和生成操作小结

最近在使用Python进行数据处理的过程中,使用for循环来进行迭代处理的次数比较多,于是萌发了要写一篇文章来总结python中迭代和生成操作,一方面加深对Python中这块知识的理解,另一方面也锻炼自己写技术类博文的能力,这篇文章算是一次尝试吧。

迭代

迭代的概念

维基百科中 迭代(Iteration) 的一个通用概念是:重复某个过程的行为,这个过程中的每次重复称为一次迭代。具体对应到Python编程中就是,对于一个可迭代对象,比如Python中的list、tuple、string、dictionary,set等,使用某种循环结构来遍历其中的元素,这种遍历就是迭代。

迭代的形式

while

python编程中可以使用while循环进行迭代。

i = 0
total = 0
while i < 100:
     total = total + i
     i = i + 1
print(total)

for

在Python编程中,利用for循环进行迭代是比较常见的一种形式。Python使用for...in...的语法结构。这点和C、Java等语言利用下标进行迭代有点不一样。下面给出几个例子。

for i in range(2):
    print(i)
# output
0
1
for s in "Max":
    print(s)
# output
M
a
x
for key in {"Python":90, "java":88, "C++":85}:
    print(key)
# output
Python
java
C++

除了上面的几种比较常见的迭代使用形式,for...in...循环中还有一些tricks。下面总结的是一些比较常见的,不一定全面。

enumerate

当我们想在一次迭代中不仅返回迭代对象中的元素的值,同时还想返回该元素对应的下标,那么就可以使用enumerate()函数,该函数能在一次迭代中同时返回元素值和对应的下标。当想建立两个迭代对象元素之间的对应关系时,enumerate可以作为一种方法。

for i, item in enumerate(['Tom', 'Tony', 'Max']):
    print("The index of {} is {}".format(item, i))
sub = ['Math', 'English']
score = [90, 88]
for i, item in enumerate(sub):
    print("The subject {} got {}".format(item, score[i]))
zip

zip是python的一个內建函数,接收一系列可迭代对象作为参数,将对象中对应的元素打包成一个个tuple(元组),然后返回由这些元组组成的list列表。若传入的对象的长度不等,则返回的list与参数中长度最短的对象相同。

z1 = [1,2,3]
z2 = [4,5,6]
for i,j in zip(z1,z2):
    print(i,j)
# output
1 4
2 5
3 6
item()

item()方法允许我们同时操作dictionary的key和value, 用起来也十分方便。

sc = {"Python":90, "java":88, "C++":85}
for key, value in sc.item():
    print(key)
    print(value)

迭代器(iterator)

迭代器是访问集合中元素的一种方式,从集合中的第一个元素开始访问,直到所有的元素都被访问一遍后结束。迭代器不能回退,只能往前进行迭代。迭代器的一个优点是不需要事先准备好集合中的所有元素,仅仅在迭代至某个元素时才计算该元素。适合用于遍历一些大的文件或集合。同时迭代器提供了一个统一的访问集合的接口,只要是定义了iter()方法的对象,就可以使用迭代器进行访问。可以被next()方法调用并不断返回下一个值的对象称为迭代器,换句话说,迭代器对象具有next()方法。生成器就是迭代器对象,list、tuple、str等虽然是可迭代对象(Iterable),但不是迭代器(Iterator)。要把一个可迭代对象转换成迭代器,可以使用iter()函数。另外可以使用isinstance()函数来判断一个对象是可迭代对象还是迭代器对象。

对于迭代器的理解,可以把迭代器看成是一个数据流,迭代器对象被next()函数调用不断返回下一个数据,直到没有数据时抛出StopIteration错误。把这个数据流看做是一个有序序列,但却不能提前知道这个数据流到底有多长,而对于list、tuple等可迭代对象来说,对象的长度是可知的。这也是可迭代对象和迭代器的区别所在。

from collections import Iterator, Iterable
a = [1, 2, 3]
b = iter(a)
isinstance(a, Iterable)  
isinstance(a, Iterator)
isinstance(b, Iterable)
isinstance(b, Iterator)
isinstance((x*x for x in range(3)), Iterator)
isinstance((x*x for x in range(3)), Iterable)

# output
True
False
True
True
True
True

生成

生成的意思是说通过某种规则产生一定的序列,在生成的过程中可能也会用到迭代操作。

列表生成式(list comprehension)

列表生成式是一种方便简洁的创建List的方式。创建一个List的一般思路可能是先创建一个空的List,然后再使用for循环进行迭代,将每次迭代生成的值通过append方法添加到List中去。

a = []
for i in range(6):
    a.append(i)
print(a)

如果使用列表生成式,代码则会相当简洁。

a = [i*2 for i in range(6)]
b = [a + b for a in range(3) for b in range(4)]

生成器(generator)

使用列表生成式的确可以生成一定规则的列表,但同时由于内存限制,列表容量是有限的。有时我们可能不想让一个列表占用太大的内存空间,我们希望在循环的过程中值是不断推算不断生成的,不必一次性创建完整的序列,从而节省内存空间。Python中就有这种一边循环一边计算的机制,这种机制叫生成器。关于生成器,还有一种定义说,带有yield的函数就被称为生成器。带有yield的函数不再是一个普通函数,python解释器会把它视为生成器。值得注意的是,生成器是可迭代对象,也是迭代器对象。

先讲一种简单的创建一个生成器的方法,就是直接把列表生成式的[]换成()就创建了一个生成器。生成器具有next()方法,用于输出每次迭代值。

a = (x*x for x in range(4))
next(a)
next(a)
for i in a:
    print(i)

值得注意的是。使用next()方法,当迭代到最后一个元素,没有更多的元素时,生成器会抛出StopIteration错误。下面通过在函数中插入yield的方法来创建生成器。

def fab(m):
    i, a, b = 0, 0, 1
    while i < m:
        yield b
        a, b = b, a+b
        i = i + 1

yield把fab函数变成了一个生成器,每次循环执行到语句 yield b 时,fab函数就返回一个迭代值,下次迭代时,代码会从 yield b 语句的下一条语句继续执行,就好像是函数执行过程中被yield中断了数次,每次中断都会通过yield返回当前的迭代值。这个过程可以通过在代码中嵌入打印一些标记来进行可视化。

def foo():
    print("begin")
    for i in range(2):
        print("before yield", i)
        yield i
        print("after yield", i)
    print("end")

f = foo()
next(f)
next(f)
next(f)

# output
begin
before yield 0
0

after yield 0
before yield 1
1

after yield 1
end
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

小结

可以使用for循环进行迭代的对象都是可迭代(Iterable)类型,可以调用next()方法的对象都是迭代器(Iterator)类型,生成器(generator)既是可迭代类型,也是迭代器类型。

参考

  1. Python Practice Book(iterator & Generator)
  2. Python迭代器 生成器
  3. 廖雪峰的Python教程
  4. Python的函数式编程指南(三):迭代器
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容