DAY4-生成器

本章内容：

生成器和生成器函数
列表推导式

生成器
什么是生成器。生成器实质就是迭代器。
在python中有三种方式来获取生成器：

通过生成器函数
通过各种推导式来实现生成器
通过数据的转换也可以获取生成器

生成器:

def func():
       print("111")
       yield 222

ret = func()
print(ret)

结果：
<generator object func at 0x10567ff68>

由此可见生成器只是简单的函数中将return换成了yield就成为了生成器。这个时候我们执行这个函数时，就不再是函数的执行了，耳塞获取这个生成器。至于如何使用？生成器的本质是迭代器。所以，我们可以直接执行next()来执行生成器。

def func():
       print("111")
       yield 222

gener = func() # 这个时候函数不会执行. ⽽而是获取到⽣成器
ret = gener.__next__() # 这个时候函数才会执行. yield的作用和return⼀样. 也是返回数据
print(ret)

结果：
111
222

那么我们可以看到, yield和return的效果是一样的. 有什么区别呢? yield是分段来执行⼀个函数. return呢? 直接停止执行函数.

def func():
       print("111") 
       yield 222 
       print("333") 
       yield 444

gener = func() 
ret = gener.__next__() 
print(ret) 
ret2 = gener.__next__() 
print(ret2)
ret3 = gener.__next__() # 最后⼀一个yield执⾏完毕. 再次__next__()程序报错, 也就是说. 和return⽆关了.
print(ret3)

结果:
Traceback (most recent call last):
111
222
333
444
  File "/Users/yangyang/PycharmProjects/study/venv/include/day1/生成器.py", line 34, in <module>
    ret3 = gener.__next__()
StopIteration

当程序运⾏完最后一个yield. 那么后面继续进行next()程序会报错.

那么生成器有什么作用呢？带着这个疑问一起看看下面的列子：

def cloth():
       lst=[]
       for i in range(0,10000):
             lst.append("衣服"+str(i))
        return lst
cl = cloth()

以上列子表示一次性生产了10000件衣服出来。在看下面列子：

def cloth():
       for i in range(0,10000):
             yield "衣服" + str(i)
cl = cloth()
print(cl.__next__())
print(cl.__next__())
print(cl.__next__())

区别: 第一种是直接一次性全部拿出来. 会很占用内存. 第二种使用生成器. 一次就⼀个. ⽤多少生成多少. 生成器是⼀个一个的指向下⼀个. 不会回去, next()到哪, 指针就指到哪儿. 下一次继续获取指针指向的值.

接下来我们看send方法。send方法和next()一样都可以让生成器执行到下一个yield中。

def eat():
    print("我吃什什么啊")
    a= yield "馒头"
    print("a=",a)
    b = yield "⼤大饼"
    print("b=",b)
    c = yield "⾲韭菜盒⼦子"
    print("c=",c)
    yield "GAME OVER"

gen = eat() # 获取⽣生成器器
ret1 = gen.__next__()
print(ret1)
ret2 = gen.send("胡辣汤")
print(ret2)
ret3 = gen.send("狗粮")
print(ret3)
ret4 = gen.send("猫粮")
print(ret4)

结果：
我吃什什么啊
馒头
a= 胡辣汤
⼤大饼
b= 狗粮
⾲韭菜盒⼦子
c= 猫粮
GAME OVER

send和next()区别

send和next()都是让生成器向下走一次.

send可以给上⼀个yield的位置传递值, 不能给最后⼀个yield发送值. 在第一次执行⽣成器代码的时候不能使用send().

生成器可以使用for循环来循环获取内部的元素：

def func():
       print(111)
       yield 222
       print(333)
       yield 444
       print(555)

gen = func()
for i in gen:
      print(i)

结果:
111
222
333
444
555

列表推导式，生成器表达式以及其他推导式。
⾸首先我们先看⼀下这样的代码, 给出⼀个列表, 通过循环, 向列表中添加1-13 :

lst = [] 
for i in range(1, 15):
        lst.append(i) 
print(lst)

替换成列列表推导式:

lst = [i for i in range(1, 15)] 
print(lst)

列表推导式是通过⼀⾏来构建你要的列表, 列表推导式看起来代码简单. 但是出现错误之后很难排查.

列表推导式的常用写法:
[ 结果 for 变量 in 可迭代对象]

还可以对列表中的数据进行筛选

[ 结果 for 变量 in 可迭代对象 if 条件 ]

# 获取1-100内所有的偶数
lst = [s for s in range(1,100) if s %2 ==0]
print(lst)

⽣成器表达式和列表推导式的语法基本上是一样的. 只是把[]替换成()

gen = (i for i in range(10)) 
print(gen)

结果:
<generator object <genexpr> at 0x106768f10>

打印结果就是一个生成器，可以用for循环来循环这个生成器

gen = ("麻花藤我第%s次爱你" % i for i in range(10)) 
for i in gen:
      print(i)

⽣成器表达式也可以进行筛选:

# 获取1-100内能被3整除的数 
gen = (i for i in range(1,100) if i % 3 == 0) 
for num in gen:
      print(num)

# 100以内能被3整除的数的平⽅方 
gen = (i * i for i in range(100) if i % 3 == 0) 
for num in gen:
      print(num)

# 寻找名字中带有两个e的⼈人的名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],
         ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']]
# 不不⽤用推导式和表达式
result = []
for first in names:
    for name in first:
        if name.count("e") >= 2:
           result.append(name)

print(result)

#使用推导式
result = (name for first in names for name in first if name.count("e") >=2 )
for name in result:
    print(name)

生成器表达式和列表推导式的区别:

列表推导式比较耗内存. 一次性加载. ⽣成器表达式几乎不占用内存. 使⽤用的时候才分配和使用内存

得到的值不⼀样. 列表推导式得到的是一个列表. 生成器表达式获取的是⼀个生成器.

就好比同样一篮子鸡蛋. 列表推导式: 直接拿到⼀篮子鸡蛋. 生成器表达式: 拿到一个老母鸡. 需要鸡蛋就给你下鸡蛋.

注意：生成器，当你需要值的时候才拿值

def func():
    print(111)
    yield 222

g = func() # ⽣成器g
g1 = (i for i in g) # ⽣成器g1. 但是g1的数据来源于g
g2 = (i for i in g1) # ⽣成器g2. 来源g1

print(list(g))
print(list(g1))
print(list(g2))

结果：
111
[222]
[]
[]

字典推导式

# 把字典中的key和value互换

def invert_dict(d):
    print ("生成器表达式")
    return dict((v,k) for k,v in d.items())

def invert_dict2(d):
    print("列表推导表达式")
    return dict([(v,k) for k,v in d.items()])

def invert_dict3(d):
    print("字典推导表达式")
    return {val:key for key,val in d.items()}

def invert_dict4(d):
      print("字典推导表达式")
      return {dic[key]: key for key in dic}

dic = {'a': 1, 'b': '2'}

print(invert_dict(dic))
print(invert_dict2(dic))
print(invert_dict3(dic))

# 在以下list中. 从lst1中获取的数据和lst2中相对应的位置的数据组成⼀一个新字典 
lst1 = ['jay', 'jj', 'sylar'] 
lst2 = ['周杰伦', '林俊杰', '邱彦涛'] 
dic = {lst1[i]: lst2[i] for i in range(len(lst1))} 
print(dic)

结果：
生成器表达式
{1: 'a', '2': 'b'}
列表推导表达式
{1: 'a', '2': 'b'}
字典推导表达式
{1: 'a', '2': 'b'}
{'jay': '周杰伦', 'jj': '林林俊杰', 'sylar': '邱彦涛'}

集合推导式：
集合推导式可以帮我们直接生成⼀一个集合. 集合的特点: 无序, 不重复. 所以集合推导式自带去重功能

#集合推导式
lst = [1, -1, 8, -8, 12] # 绝对值去重
s = {abs(i) for i in lst}
print(s)

结果
{8, 1, 12}

总结: 推导式有, 列表推导式, 字典推导式, 集合推导式, 没有元组推导式
生成器表达式: (结果 for 变量量 in 可迭代对象 if 条件筛选)
生成器表达式可以直接获取到生成器对象. 生成器对象可以直接进行for循环. ⽣生成器具有惰性机制.

一个面试题：

def add(a, b):
    return a + b

# 0 1 2 3
def test():
    for r_i in range(4):
        yield r_i

g = test()
for n in [2, 10]:
        # 生成器的惰性 第一次循环是没有执行 只是把代码跑了一遍，第二次循环是就把第一次的代码带到了第二次的g中
        # (add(10, i) for i in g) 10 11 12 13
        # (add(10, i) for i in (add(10, i) for i in g))
        g = (add(n, i) for i in g)

print(list(g))

结果：
[20, 21, 22, 23]

DAY4-生成器

注意：生成器，当你需要值的时候才拿值

推荐阅读更多精彩内容