1:生成器定义:
在Python中,一边循环一边计算的机制,称为生成器:generator。
2:为什么要有生成器
列表所有数据都在内存中,如果有海量数据的话将会非常耗内存。
如:仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
如果列表元素按照某种算法推算出来,那我们就可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间。
简单一句话:我又想要得到庞大的数据,又想让它占用空间少,那就用生成器!
3:原理
生成器(generator)是构造新的可迭代对象的一种简单方式。一般的函数return只会返回单个值,而生成器并不是直接将可迭代值直接放入内存中,而是以延迟的方式返回一个值序列,即每返回一个值之后暂停,直到下一个值被请求时再继续,可有效节省内存占用。要构建一个生成器,则需要用到关键字yield,yield的作用与函数的返回值return有些类似,通过在函数中将return替换成yield就是把函数变成生成器,带有 yield 的函数不再是普通函数,python 解释器会将函数对象视为生成器对象,并且该生成器返回的是yield表达式生成的可迭代值序列,可通过for循环等方法依次读取生成器返回的可迭代值序列,但生成器生成的可迭代值只可以被读取一次,每一次迭代都是按生成器代码流程遇见yield表达式就返回值并记录位置后中止留待下一次迭代,下一次迭代时执行代码的起始位置是从上一次记录位置开始,直至整个生成器代码运行结束
创建生成器
方法一:
L = [x * x for x in range(10)]
L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
g = (x * x for x in range(10))
g
<generator object <genexpr> at 0x1022ef630>
创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator
方法二:
如果一个函数中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator。调用函数就是创建了一个生成器(generator)对象
示例:
将普通函数的return关键字替换成yield关键字,函数yield_test()将被视为生成器(generator)
yield与return同样返回值,记录位置后中止,下次迭代从该位置开始按代码流程执行直至再次遇见yield
每一次迭代都是遇到yield就中止并返回yield表达式的值,下次迭代从上次迭代yield后面的代码开始执行
1:定义生成器(与函数类似的生成器)
def yield_test(n):
yield n*2
print('n=' , n)
#执行other代码
print('do something.')
print('end.')
调用生成器
for i in yield_test(5):
print(i, ',')
print('next')
执行调用生成器的 for i in yield_test(5)语句时,因生成器yield_test()的返回值yield n*2虽然是可迭代对象但并没有可供循环的可迭代值(只有一个n=5时的yield返回值n*2=10),因此 for i in yield_test(5)实际只进行了2次循环,循环第1次在执行代码 yield n*2后中止并返回 yield n*2的值,生成器返回值调用结束后,循环第2次继续上次执行yield n*2后的剩余生成器代码也就是print(‘n=’ ,n)直至yield_test()代码结束后退出
2:生成器(完整执行多次调用for循环代码的生成器)
#定义生成器
def yield_test(n):
for r in range(n):
yield r*2
print('r=' , r)
#执行other代码
print('do something.')
print('end.')
#调用生成器
for i in yield_test(5):
print(i, ',')
print('next')
结果:
#使用for i in yield_test()调用生成器第一次
0 , #执行for r in range()第一次循环 r=0 时的语句yield r*2
next
#调用生成器第二次
r= 0 #执行for r in range()第一次循环 r=0 时的语句print('r=' , i)
2 , #执行for r in range()第二次循环 r=1 时的语句yield r*2
next
#调用生成器第三次
r= 1 #执行for r in range()第二次循环 r=1 时的语句print('r=' , i)
4 , #执行for r in range()第三次循环 r=2 时的语句yield r*2
next
#调用生成器第四次
r= 2 #执行for r in range()第三次循环 r=2 时的语句print('r=' , i)
6 , #执行for r in range()第四次循环 r=3 时的语句yield r*2
next
#调用生成器第五次
r= 3 #执行for r in range()第四次循环 r=3 时的语句print('r=' , i)
8 , #执行for r in range()第五次循环 r=4 时的语句yield r*2
next
#继续执行生成器代码直至结束
r= 4 #执行for r in range()第五次循环 r=4 时的语句print('r=' , i)
do something.
end.
执行循环调用 for i in yield_test(5) 的 print(i, ‘,’) 语句时,生成器yield_test()的返回值yield n*2 是可迭代对象并存在可供循环的可迭代值(range(5)时的返回值序列[0,2,4,6,8]),因此print(i , ‘,’)将循环使用5次,循环第1次在n=0时执行代码 yield n*2后中止并返回 yield n*2的值,在生成器返回值调用print(‘next’)结束后,循环第2次继续执行yield n*2后的剩余生成器代码也就是print(‘r=’ ,r)并在n=1时执行代码yield n*2后中止并返回yield n*2的值,如此往复直至yield_test()代码结束
总结
1:带有 yield 的函数不再是一个普通函数,而是一个生成器generator。
可用next()调用生成器对象来取值。next 两种方式 t.next() | next(t)。
可用for 循环获取返回值(每执行一次,取生成器里面一个值)
(基本上不会用next()来获取下一个返回值,而是直接使用for循环来迭代)。
2:yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。
3:生成器代码的执行顺序,外部循环调用生成器返回的可迭代值yield时,yield会记录下生成器内部循环位置等待下次调用,再次调用会从上次记录位置开始执行内部循环代码至yield返回值,如此往复,当生成器内部的可迭代值已全部使用一遍后,才会执行生成器内部循环外的代码