python生成器是怎样工作的

第一部分

  • 在掌握python生成器之前,你需要理解普通的python函数是如何工作的。通常,当一个python函数调用一个子程序时,子程序保留控制权直到它返回,或者抛出一个异常。然后控制权被交还给调用者(父程序)。
>>> def foo():
...     bar()
...
>>> def bar():
...     pass

python的标准解释器是由C写成的。自然美妙地,一个Python函数被调用时,由C函数PyEval_EvalFrameEx来执行这个Python函数。它接受python的一个栈帧对象,然后在帧的上下文中评估python的字节码。下面是foo的字节码:

>>> import dis
>>> dis.dis(foo)
  2           0 LOAD_GLOBAL              0 (bar)
              3 CALL_FUNCTION            0 (0 positional, 0 keyword pair)
              6 POP_TOP
              7 LOAD_CONST               0 (None)
             10 RETURN_VALUE

foo函数加载bar到它的栈上然后调用它,然后从栈中弹出它的返回值,再在foo函数中加载返回值None到栈上,然后返回None
PyEval_EvalFrameEx遇到一个CALL_FUNCTION字节码时,它创建一个新的python栈帧然后递归:这意味着它递归调用了PyEval_EvalFrameEx,传入新的栈帧对象,该对象被用来执行bar函数。
关键的是,要明白Python的栈帧是在堆内存中分配的!Python的解释器是一个普通的C程序,所以它的栈帧都是常规的栈帧。但是它操纵的python栈帧都是在堆上的。这意味着Python的栈帧能够比它的函数调用活得更久。要交互式地看到这一点,在bar函数中保存当前栈帧即可:

>>> import inspect
>>> frame = None
>>> def foo():
...     bar()
...
>>> def bar():
...     global frame
...     frame = inspect.currentframe()
...
>>> foo()
>>> # The frame was executing the code for 'bar'.
>>> frame.f_code.co_name
'bar'
>>> # Its back pointer refers to the frame for 'foo'.
>>> caller_frame = frame.f_back
>>> caller_frame.f_code.co_name
'foo'
函数调用

第二部分

  • 现在暖场结束,舞台交给python的生成器,它利用了同样的建筑模块——代码对象和栈帧——来达到奇妙的效果。
    下面是一个生成器函数:
>>> def gen_fn():
...     result = yield 1
...     print('result of yield: {}'.format(result))
...     result2 = yield 2
...     print('result of 2nd yield: {}'.format(result2))
...     return 'done'
...     

当python编译gen_fn为字节码时,它看到yield语句并且知道gen_fn为一个生成器函数,而不是一个普通函数。它设置了一个标志来记住这一事实:

>>> # The generator flag is bit position 5.
>>> generator_bit = 1 << 5
>>> bool(gen_fn.__code__.co_flags & generator_bit)
True

当你调用一个生成器函数,python看到生成器标志,然后它实际上并没有去执行函数而是创建了一个生成器对象:

>>> gen = gen_fn()
>>> type(gen)
<class 'generator'>

一个python生成器对象将一个栈帧,一些代码的引用即gen_fn函数体包裹在一起:

>>> gen.gi_code.co_name
'gen_fn'

所有调用gen_fn函数得到的生成器对象都指向这同样的代码。但是每一个都有它自己的栈帧。这个栈帧并不在任何真正的栈上,它坐在堆内存中等待被使用:

生成器

该帧有一个“最后的指令”的指针,指向它最近一次执行的命令。在一开始,这个指针的值是-1,意味着生成器并没有开始:

>>> gen.gi_frame.f_lasti
-1

当我们调用send方法时,生成器抵达它第一个yield,然后暂停。send的返回值是1。

>>> gen.send(None)
1

现在生成器对象的指令指针的位置距离开始隔了3字节码长度,完成了编译好的56字节的python代码的一部分。

>>> gen.gi_frame.f_lasti
3
>>> len(gen.gi_code.co_code)
56

该生成器能在任何时间被唤醒,被任何函数使用,因为它的栈帧并没有真正在栈上:它是在堆上的。它在调用层级中的位置并不固定,而且它不需要遵守先入后出的执行顺序(常规函数就需要)。它是解放的,自由得像空中漂浮的云朵。

我们可以传入值"hello"到生成器中,然后它就成了yield表达式的值,然后生成器持续运行到它生成2:

>>> gen.send('hello')
result of yield: hello
2

它的栈帧现在拥有本地变量result

>>> gen.gi_frame.f_locals
{'result': 'hello'}

其它用gen_fn 创建出的生成器将会拥有他们自己的栈帧和本地变量。
当我们再次调用send函数时,该生成器从它第二个yield开始运行,执行完之后的代码,最后以抛出一个StopIteration异常结束:

>>> gen.send('goodbye')
result of 2nd yield: goodbye
Traceback (most recent call last):
  File "<input>", line 1, in <module>
StopIteration: done

这个异常也是有值的,那就是生成器的返回值:字符串"done"

附录:

本文英文原文来自于 500 lines or less -- A Web Crawler With asyncio Coroutines中的How Python Generators Work一节,由于相对独立,单独出来便于参考。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,402评论 6 499
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,377评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,483评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,165评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,176评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,146评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,032评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,896评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,311评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,536评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,696评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,413评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,008评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,815评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,698评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,592评论 2 353

推荐阅读更多精彩内容

  • title标题: A Web Crawler With asyncio Coroutinesauthor作者: A...
    彰乐乐乐乐阅读 2,053评论 0 8
  • 〇、前言 本文共108张图,流量党请慎重! 历时1个半月,我把自己学习Python基础知识的框架详细梳理了一遍。 ...
    Raxxie阅读 18,952评论 17 410
  • 或许在经历过一段饱含深情却又伤痕累累的爱情之后,我们都累了,或许我们自认为以后再难对第二个人有这样疯狂的爱恋。 然...
    喳西阅读 398评论 0 1
  • 俗话说,一孕傻三年。而我不小心傻了六年。各种焦虑不安,我开始尝试倾听内心的声音,很幸运遇见了inLight平台,我...
    水梦曦阅读 186评论 0 0
  • 还剩两年 我想要努力一把 考验去北京 把现在自己喜欢的游戏、音乐、小说放下 我渴望更高的“世界” 也害怕自己懒...
    三爷正年少阅读 262评论 0 1