要理解yield,必须先清楚可迭代对象、迭代器和生成器的概念。
一、可迭代对象
大部分对象都是可迭代,只要实现了__iter__
方法的对象(可以是自定义的容器)就是可迭代的,例如常见的list、tuple、str, set。
__iter__
方法会返回迭代器(iterator)本身。
判断一个对象是否是可迭代对象的方法:
isinstance(Object, Iterable)
可迭代对象一般都用for循环遍历元素,也就是能用for循环的对象都可称为可迭代对象, 如何对非可迭代对象使用for会报错。
可迭代对象生成后, 所有的值都存在内存当中,并不适合大量数据。
二、迭代器
具有next方法的对象都是迭代器。在调用next方法时,迭代器会返回它的下一个值。如果next方法被调用,但迭代器没有值可以返回,就会引发一个StopIteration异常,通过except 这个异常可以判断迭代器遍历完成。
使用迭代器的好处:
1)如果使用列表,计算值时会一次获取所有值,那么就会占用更多的内存。而迭代器则是一个接一个计算。
2)使代码更通用、更简单。
三、生成器
1)任何包含yield语句的函数都称为生成器。
2)生成器都是一个迭代器,但迭代器不一定是生成器。
对于生成器, 只有你需要的时候它才会求值, 这也是和可迭代对象的区别。
3 ) 一般生成器都是通过生成器推导式或者包含yield的函数声明
----生成器推导式和组建:
变量L= (item或item表达式 for item in 列表/集合)
# 通过`yield`来创建生成器
def func():
for i in xrange(10);
yield i
# 通过列表来创建生成器
[i for i in xrange(10)]
4 ) 带有 yield 的函数不再是一个普通函数,而是一个生成器generator,可用于迭代。
yield的作用:
1.它和return差不多的用法,只是拥有它的语法结构最后是返回了一个生成器。
2.了解yield 必须知道,当你调用yield所在的那个函数或者生成器表达式的时候,那个函数并没有运行,只会返回一个生成器的对象。
3.当你第一次在for中调用生成器的的对象,它将会运行你函数中的代码从最开始一直到到碰到了yield的关键字,然后它会返回循环中的第一个值。然后每一次其他的调用将会运行你在这个函数中所写的循环多一次(第二次循环从第一次返回的yield位置后面开始到遇到下一个yield
),并且返回下一个值,直到没有值可以返回了,此时迭代器遍历完成。
与生成器(实际上是迭代器)相关的next()和send()方法:
生成器可以被for调用, 也可以使用send和next方法手动进行遍历控制,实现更复杂的功能。
对于普通的生成器,第一个next调用,相当于启动生成器,会从生成器函数的第一行代码开始执行,直到第一次执行完yield语句
send(msg)与next()都有返回值,它们的返回值是当前迭代遇到yield时,yield后面表达式的值,其实就是当前迭代循环()中yield后面的参数。
第一次调用时必须先next()或send(None),否则会报错,send后之所以为None是因为这时候没有上一个yield(根据第8条)。可以认为,next()等同于send(None)。
区别是:
send可以强行修改上一个yield表达式值, 多了一次赋值的动作。
send语句伴随着类似n1 = yield ret
的结构, 旨在从循环外传入数据而影响循环。
注意, 从第二次循环开始, send语句传递赋值到 n1 然后继续执行循环并遇到下一个yield。
具体流程参考
python中yield控制的协程
协程是一种用户态的轻量级线程,又称微线程,英文名Coroutine,本质上还是一个线程
, 拥有线程的共享代码段(代码和常量),数据段(全局变量和静态变量),扩展段(堆存储)。协程的调度完全由用户控制。人们通常将协程和子程序(函数)比较着理解。
子程序调用总是一个入口,一次返回,一旦退出即完成了子程序的执行。
协程的起始处是第一个入口点,在协程里,返回点之后是接下来的入口点。在python中,协程可以通过yield来调用其它协程。通过yield方式转移执行权的协程之间不是调用者与被调用者的关系,而是彼此对称、平等的,通过相互协作共同完成任务。其运行的大致流程如下:
- 第一步,协程A开始执行。
- 第二步,协程A执行到一半,进入暂停(这里是生成器完成一次生成),通过yield命令将执行权转移到协程B。
- 第三步,(一段时间后)协程B交还执行权并传递信息给下一次生成循环(send方法)。
- 第四步,协程A恢复执行。