本章内容:
生成器和生成器函数
列表推导式
- 生成器
什么是生成器。生成器实质就是迭代器。
在python中有三种方式来获取生成器:
- 通过生成器函数
- 通过各种推导式来实现生成器
- 通过数据的转换也可以获取生成器
生成器:
def func():
print("111")
yield 222
ret = func()
print(ret)
结果:
<generator object func at 0x10567ff68>
由此可见生成器只是简单的函数中将return换成了yield就成为了生成器。这个时候我们执行这个函数时,就不再是函数的执行了,耳塞获取这个生成器。至于如何使用?生成器的本质是迭代器。所以,我们可以直接执行next()来执行生成器。
def func():
print("111")
yield 222
gener = func() # 这个时候函数不会执行. ⽽而是获取到⽣成器
ret = gener.__next__() # 这个时候函数才会执行. yield的作用和return⼀样. 也是返回数据
print(ret)
结果:
111
222
那么我们可以看到, yield和return的效果是一样的. 有什么区别呢? yield是分段来执行⼀个 函数. return呢? 直接停止执行函数.
def func():
print("111")
yield 222
print("333")
yield 444
gener = func()
ret = gener.__next__()
print(ret)
ret2 = gener.__next__()
print(ret2)
ret3 = gener.__next__() # 最后⼀一个yield执⾏完毕. 再次__next__()程序报错, 也就是说. 和return⽆关了.
print(ret3)
结果:
Traceback (most recent call last):
111
222
333
444
File "/Users/yangyang/PycharmProjects/study/venv/include/day1/生成器.py", line 34, in <module>
ret3 = gener.__next__()
StopIteration
当程序运⾏完最后一个yield. 那么后面继续进行next()程序会报错.
那么生成器有什么作用呢?带着这个疑问一起看看下面的列子:
def cloth():
lst=[]
for i in range(0,10000):
lst.append("衣服"+str(i))
return lst
cl = cloth()
以上列子表示一次性生产了10000件衣服出来。在看下面列子:
def cloth():
for i in range(0,10000):
yield "衣服" + str(i)
cl = cloth()
print(cl.__next__())
print(cl.__next__())
print(cl.__next__())
区别: 第一种是直接一次性全部拿出来. 会很占用内存. 第二种使用生成器. 一次就⼀个. ⽤多少生成多少. 生成器是⼀个一个的指向下⼀个. 不会回去, next()到哪, 指针就指到哪儿. 下一次继续获取指针指向的值.
接下来我们看send方法。send方法和next()一样都可以让生成器执行到下一个yield中。
def eat():
print("我吃什什么啊")
a= yield "馒头"
print("a=",a)
b = yield "⼤大饼"
print("b=",b)
c = yield "⾲韭菜盒⼦子"
print("c=",c)
yield "GAME OVER"
gen = eat() # 获取⽣生成器器
ret1 = gen.__next__()
print(ret1)
ret2 = gen.send("胡辣汤")
print(ret2)
ret3 = gen.send("狗粮")
print(ret3)
ret4 = gen.send("猫粮")
print(ret4)
结果:
我吃什什么啊
馒头
a= 胡辣汤
⼤大饼
b= 狗粮
⾲韭菜盒⼦子
c= 猫粮
GAME OVER
send和next()区别
- send和next()都是让生成器向下走一次.
- send可以给上⼀个yield的位置传递值, 不能给最后⼀个yield发送值. 在第一次执行⽣成器代码的时候不能使用send().
生成器可以使用for循环来循环获取内部的元素:
def func():
print(111)
yield 222
print(333)
yield 444
print(555)
gen = func()
for i in gen:
print(i)
结果:
111
222
333
444
555
- 列表推导式,生成器表达式以及其他推导式。
⾸首先我们先看⼀下这样的代码, 给出⼀个列表, 通过循环, 向列表中添加1-13 :
lst = []
for i in range(1, 15):
lst.append(i)
print(lst)
替换成列列表推导式:
lst = [i for i in range(1, 15)]
print(lst)
列表推导式是通过⼀⾏来构建你要的列表, 列表推导式看起来代码简单. 但是出现错误之后很难排查.
列表推导式的常用写法:
[ 结果 for 变量 in 可迭代对象]
还可以对列表中的数据进行筛选
[ 结果 for 变量 in 可迭代对象 if 条件 ]
# 获取1-100内所有的偶数
lst = [s for s in range(1,100) if s %2 ==0]
print(lst)
- ⽣成器表达式和列表推导式的语法基本上是一样的. 只是把[]替换成()
gen = (i for i in range(10))
print(gen)
结果:
<generator object <genexpr> at 0x106768f10>
打印结果就是一个生成器,可以用for循环来循环这个生成器
gen = ("麻花藤我第%s次爱你" % i for i in range(10))
for i in gen:
print(i)
⽣成器表达式也可以进行筛选:
# 获取1-100内能被3整除的数
gen = (i for i in range(1,100) if i % 3 == 0)
for num in gen:
print(num)
# 100以内能被3整除的数的平⽅方
gen = (i * i for i in range(100) if i % 3 == 0)
for num in gen:
print(num)
# 寻找名字中带有两个e的⼈人的名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],
['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']]
# 不不⽤用推导式和表达式
result = []
for first in names:
for name in first:
if name.count("e") >= 2:
result.append(name)
print(result)
#使用推导式
result = (name for first in names for name in first if name.count("e") >=2 )
for name in result:
print(name)
生成器表达式和列表推导式的区别:
- 列表推导式比较耗内存. 一次性加载. ⽣成器表达式几乎不占用内存. 使⽤用的时候才分配和使用内存
- 得到的值不⼀样. 列表推导式得到的是一个列表. 生成器表达式获取的是⼀个生成器.
就好比同样一篮子鸡蛋. 列表推导式: 直接拿到⼀篮子鸡蛋. 生成器表达式: 拿到一个老母鸡. 需要鸡蛋就给你下鸡蛋.
注意:生成器,当你需要值的时候才拿值
def func():
print(111)
yield 222
g = func() # ⽣成器g
g1 = (i for i in g) # ⽣成器g1. 但是g1的数据来源于g
g2 = (i for i in g1) # ⽣成器g2. 来源g1
print(list(g))
print(list(g1))
print(list(g2))
结果:
111
[222]
[]
[]
- 字典推导式
# 把字典中的key和value互换
def invert_dict(d):
print ("生成器表达式")
return dict((v,k) for k,v in d.items())
def invert_dict2(d):
print("列表推导表达式")
return dict([(v,k) for k,v in d.items()])
def invert_dict3(d):
print("字典推导表达式")
return {val:key for key,val in d.items()}
def invert_dict4(d):
print("字典推导表达式")
return {dic[key]: key for key in dic}
dic = {'a': 1, 'b': '2'}
print(invert_dict(dic))
print(invert_dict2(dic))
print(invert_dict3(dic))
# 在以下list中. 从lst1中获取的数据和lst2中相对应的位置的数据组成⼀一个新字典
lst1 = ['jay', 'jj', 'sylar']
lst2 = ['周杰伦', '林俊杰', '邱彦涛']
dic = {lst1[i]: lst2[i] for i in range(len(lst1))}
print(dic)
结果:
生成器表达式
{1: 'a', '2': 'b'}
列表推导表达式
{1: 'a', '2': 'b'}
字典推导表达式
{1: 'a', '2': 'b'}
{'jay': '周杰伦', 'jj': '林林俊杰', 'sylar': '邱彦涛'}
- 集合推导式:
集合推导式可以帮我们直接生成⼀一个集合. 集合的特点: 无序, 不重复. 所以集合推导式自带去重功能
#集合推导式
lst = [1, -1, 8, -8, 12] # 绝对值去重
s = {abs(i) for i in lst}
print(s)
结果
{8, 1, 12}
总结: 推导式有, 列表推导式, 字典推导式, 集合推导式, 没有元组推导式
生成器表达式: (结果 for 变量量 in 可迭代对象 if 条件筛选)
生成器表达式可以直接获取到生成器对象. 生成器对象可以直接进行for循环. ⽣生成器具有惰性机制.
一个面试题:
def add(a, b):
return a + b
# 0 1 2 3
def test():
for r_i in range(4):
yield r_i
g = test()
for n in [2, 10]:
# 生成器的惰性 第一次循环是没有执行 只是把代码跑了一遍,第二次循环是就把第一次的代码带到了第二次的g中
# (add(10, i) for i in g) 10 11 12 13
# (add(10, i) for i in (add(10, i) for i in g))
g = (add(n, i) for i in g)
print(list(g))
结果:
[20, 21, 22, 23]