迭代器协议
1.迭代器协议是指:对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个StopIteration异常,以终止迭代 (只能往后走不能往前退)
2.可迭代对象:实现了迭代器协议的对象(如何实现:对象内部定义一个__iter__()方法)
3.协议是一种约定,可迭代对象实现了迭代器协议,python的内部工具(如for循环,sum,min,max函数等)使用迭代器协议访问对象。
for 循环机制
for循环的本质:循环所有对象,全都是使用迭代器协议。
for循环就是基于迭代器协议提供了一个统一的可以遍历所有对象的方法,即在遍历之前,先调用对象的__iter__方法将其转换成一个迭代器,然后使用迭代器协议去实现循环访问,这样所有的对象就都可以通过for循环来遍历了,
列表,字符串,元组,字典,集合,文件对象等本质上来说都不是可迭代对象,在使用for循环的时候内部是先调用他们内部的_iter_方法,使他们变成了可迭代对象,然后在使用可迭代对象的_next_方法依次循环元素,当元素循环完时,会触发StopIteration异常,for循环会捕捉到这种异常,终止迭代
#迭代器协议访问
li =[1,2,3,4]
f =
li.__iter__()#第一步,先通过内部的_iter_方法,先把对象变成可迭代对象
print(f.__next__())#对可迭代对象用_next_方法取值
print(f.__next__())
print(f.__next__())
print(f.__next__())
print(f.__next__())#StopIteration,超出边界会报错
#for循环访问
#for循环的本质就是遵循迭代器协议的访问方式,先调用iter_i=i.__iter__()方法,或者直接iter_i=iter(l),然后依次执行iter_i.next(),直到for循环捕捉到StopIteration终止循环
li =[1,2,3,4]
for i inli:#li_iter = li._iter_()
print(i)#li_iter._next_
#用while去模拟for循环做的事情
iter_i=i.__iter__()
while True:
try:
print(iter_i.__next__())
except StopIteration:
print('迭代完毕了,循环终止了')
break
生成器
生成器类似于一种数据类型,这种数据类型自动实现了迭代器协议(其他的数据类型需要调用自己内置的__iter__方法),所以生成器就是可迭代对象
生成器分类及在python中的表现形式:(Python有两种不同的方式提供生成器)
1.生成器函数:常规函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行
2.生成器表达式:类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表,按需取出对象
为何使用生成器之生成器的优点
Python使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这也是生成器的主要好处。
三元表达式: f=result =值1 if 条件 else 值2
列表解析:s = [三元表达式],列表解析生成的是一个真实存在于内存中的列表,对于比较大的列表,比较耗内存空间
count=[x for
x in range(3)]#列表解析
count=(x for x in range(3))#生成器本身就是迭代器,遵循迭代器协议
生成器表达式2:yield函数,生成器使用yield语句返回一个值。yield语句挂起该生成器函数的状态,保留足够的信息,以便之后从它离开的地方继续执行
send():可对yield函数传参数,参数会赋值给yield函数前的变量,通过send()可实现伪并发功能
def count():
print(1)
yield ("a")#相当于return,不同于return,yield可以返回多个值
print(2)
yield ("b")
f=count()
print(f.__next__())#保留当前执行状态,下次执行从上次状态处继续往下执行
print(f.__next__())
print(f.__next__())#执行只能一直往前走,不能往后,只能执行一次,执行完继续执行会触发StopIteration
#伪并发
import time#导入时间模块
defguke(name):
print("我是%s,我准备吃包子了"%name)
while True:
baozi = yield
time.sleep(1)
print("我是%s,我把包子%s吃掉了"%(name,baozi))
defshengchanzhe(x):
xiaofeizhe = guke(x)
xiaofeizhe.__next__()
for i in range(100):
time.sleep(1)
xiaofeizhe.send(i)#将i赋值给guke()函数中yield前面的包子,下次执行时从此往后执行
use_name =
input("欢迎您!怎么称呼您:")
print("请稍等!包子马上就给您端上来")
shengchanzhe(use_name)
# 生成器只能遍历一次
defget_province_population(filename):
with open(filename) as f:
for line in f:
yield int(line)
gen =get_province_population('data.txt')
print(gen)
all_population= sum(gen)
print(all_population)
forpopulation in gen:
print(population / all_population)
执行上面这段代码,将不会有任何输出,这是因为,生成器只能遍历一次。
生成器总结:
1.语法上和函数类似:生成器函数和常规函数几乎是一样的。它们都是使用def语句进行定义,差别在于
生成器使用yield语句返回一个值,而常规函数使用return语句返回一个值
2.自动实现迭代器协议:由于生成器自动实现了迭代器协议,所以我们可以调用它的next方法,并且,在没有值可以返回的时候,生成器自动产生StopIteration异常
3.状态挂起:生成器使用yield语句返回一个值。yield语句挂起该生成器的状态,保留足够的信息,以便之后从它离开的地方继续执行。
4.生成器只能遍历一次,不能重复使用:在程序中如果已经使用生成器遍历过一次得到结果,那么第二次遍历生成器将得不到任何结果,因为在第一次遍历生成器时,生成器已经遍历到头,它的特性决定它无法遍历第二次。
总结:
1.生成器就是特殊的迭代器,它在迭代器的基础上再次进行了封装,生成器是协程的基础,协程是通过上下文切换进行任务协作的,而生成器挂起状态的特性很好地满足了协程的需求;
2.凡是可以被for循环访问的都是迭代器,这是因为迭代器里面实现了iter协议和next方法;