假如你需要创建一个很大很大的列表,但你只需要列表中的某几个元素,这样就会造成浪费,因为大部分的元素对你而言都没有用,而这些没有用的元素却依旧占用着内存。
如果类表中的元素可以通过某种算法推算出来,我们可以在循环的过程中不断推算出来后续元素,这样就不需要创建完整的list了。在Python中就提供了一个叫生成器的东西可以解决这个问题:generator。
我们前面学了列表生成式,生成器只需要将列表生成式中的[ ]改成( )就可以了。
>>> g = (x * x for x in range(10))
>>> g
<generator object <genexpr> at 0x1057af0a0>
如果你想打印 g 中的每一个元素可以通过next()函数获取generator的下一个元素:
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g)
9
>>> next(g)
16
>>> next(g)
25
>>> next(g)
36
>>> next(g)
49
>>> next(g)
64
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
File "<pyshell#13>", line 1, in <module>
next(g)
StopIteration
```
如果下一个元素不存在,就会报错。而且next()函数太麻烦了,你可以使用for循环:
```
>>> g = (x * x for x in range(10))
>>> for x in g:
print(x)
0
1
4
9
16
25
36
49
64
81
```
> 提醒:如果上面这一步你没有重新创建 g ,而是直接执行for循环的话,你会发现什么也打印不出来,因为generator中的指针已经指到了generator的末尾了。
怎么样!生成器中的元素都是在你需要的时候才通过算法生成的,所以不会浪费内存空间。
但是,有时候这个算法会特别复杂,用类似于列表生成式的for循环无法实现,这时候你可以使用函数来实现这个算法。
比如,斐波拉契数列,前两个数已知,后面的数都是它前面两个数的和:
1,1,2,3,5,8,13,21,34……
你无法用列表生成式的方式写出来。但你可以使用函数:
```
def fib(max):
n, a, b = 0, 0, 1
while n < max:
print(n)
a, b = b, a+b
n = n+1
return 'done'
```
事实上,这就是一个推导斐波那契数列的算法,跟generator很像,可以从第一个元素开始,依次推导出后面的元素。
如果你想让函数变成一个generator的话很简单,只需要将上面的print(n)变成 yield b 就可以了。
```
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a+b
n = n+1
return 'done'
```
这样fib()函数返回的就是一个generator对象了:
```
>>> f = fib(7)
>>> f
<generator object fib at 0x1057af0a0>
```
这时比较难以理解的一点是,此时generator的执行流程跟函数的执行流程不一样。函数是顺序执行的,遇到return或者函数末尾时会返回,而通过函数来生成generator的时候,执行流程就不一样了。generator会在遇到next()的时候执行,遇到yield的时候返回,再次执行时,从上一次返回的yield语句继续执行。
举个例子:
```
def test():
print('first')
yield 1
print('second')
yield 2
print('third')
yield 3
```
首先得到generator对象,然后通过next()函数不断地得到下一个返回值:
```
>>> t = test()
>>> next(t)
first
1
>>> next(t)
second
2
>>> next(t)
third
3
>>> next(t)
Traceback (most recent call last):
File "<pyshell#50>", line 1, in <module>
next(t)
StopIteration
```
这里的test不是普通的函数,而是一个generator。它在执行过程中,遇到yield就中断,并返回yield后面跟着的值,下次又从中断的地方继续执行。
再回到fib的例子中,我们第一次调用next()的时候,fib函数开始执行,它在yield的地方返回b的值,也就是1,然后它就中断了,等待着你第二次调用next(),你第二次调用next()的时候,它从上次中断的地方开始执行,a = b,b = a + b,n = n + 1,紧接着又遇到了yield了,又返回b,并中断。然后你第三次调用next(),它又从上次中断的地方开始执行……
当然我们一般情况下不会直接调用next(),我们通常使用for循环:
```
>>> for n in fib(6):
print(n)
1
1
2
3
5
8
```
不过需要注意的一点是,使用for循环你是得不到最终函数return的结果的。如果你想得到return值,你需要捕获StopIteration错误,返回值包含在StopIteration的value中:
```
>>> g = fib(6)
>>> while true:
try:
x = next(g)
print('g:', x)
except StopIteration as e:
print('函数返回值:', e.value)
break;
g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
函数返回值: done
```
捕获错误会在后面讲。