1、迭代器模式(Iterator Pattern)
扫描内存存放不下的数据集时,我们要找到一种惰性获取数据项的方式,即按需一次获取一个数据项,这就是迭代器模式。
2、生成器与迭代器的关系和基本概念
所有的生成器都是迭代器,迭代器用于从集合中取出元素,而生成器用于’凭空生成元素‘。
3、迭代器支持所支持的:
- 所有集合都可以迭代
- for循环
- 逐行遍历文本文件
- 列表推导、字典推导和集合推导
- 元组拆包
- 调用函数时,使用*拆包实参数
4、iter(...)内置函数如何把序列变得可以迭代
- 为什么所有的序列都可以迭代(都是可迭代对象)?
- Sentence类第一版:单词序列
# -*- utf8 -*-
import re
import reprlib
RE_WORD = re.compile('\w+')
class Sentence:
"""
re.findall函数返回一个字符串列表,里面的元素是正则表达式的全部非重叠匹配
self.words中保存的是。findall函数返回的结果,因此直接返回指定索引位上的单词
为了完善序列协议,我们实现了__len__方法,不过,为了让对象可以迭代,没必要实现这个方法
reprlib.repr这个实用函数用于生成大型数据结构的简略字符串表示形式
"""
def __init__(self, text):
self.text = text
self.words = RE_WORD.findall(text)
def __getitem__(self, index):
return self.words[index]
def __len__(self):
return len(self.words)
def __repr__(self):
return 'Sentence(%s)' % reprlib.repr(self.text)
s = Sentence('"The time has come," the Walrus said,')
print(s)
for word in s:
print(word)
#Sentence('"The time ha... Walrus said,')
#The
#time
#has
#come
#the
#Walrus
#said
- 当for循环迭代s对象的时候,会自动调用iter(s),iter是python的内置函数
- iter函数有三个作用,1、检查s对象是否实现了__ iter __方法,如果实现就调用它,获取一个迭代器。2、如果没有实现__ iter __方法,但是实现了__ getitem __方法,Python会创建一个迭代器,尝试按顺序(从索引0开始)获取元素。3、如果尝试失败,Python抛出TypeError异常,通常是TypeError: 'Sentence' object is not iterable。
- 当你给上面的__ getitem __函数改名字或者去掉,再运行就会报错。
5、可迭代对象与迭代器的对比
- 如果对象实现了能返回迭代器的__ iter __方法或者实现了__ getitem __方法并且其参数是从零开始的索引,这些对象通通都称为可迭代的对象。
- 所以明确可迭代的对象和迭代器之间的关系是:Python从可迭代的对象中获取迭代器。
# ’ABC‘为可迭代的对象,背后是有迭代器的,只是我们看不到。
s = 'ABC'
for char in s:
print(char)
# 使用可迭代对象构建迭代器it
# 不断在迭代器上调用next函数,获取下一个字符。
# 如果没有字符了,迭代器会抛出StopIteration异常。
# 释放对it的引用,废弃迭代器对象
# 退出循环
s = 'ABC'
it = iter(s)
while True:
try:
print(next(it))
except StopIteration:
del it
break
- 上面都是输出ABC,可以看到Python语言内部会处理for循环和其他迭代上下文(列表推导,元组拆包等)中的StopIteration异常。而while没有得自己捕获。
- 标准的迭代器中有两个方法:
__ next __ 返回下一个可用元素,如果没有元素了,就抛出StopIteraction异常。
__ iter __ 返回self,以便在应该使用可迭代对象的地方使用迭代器,例如for循环。
s3 = Sentence('Pig and Pepper')
it = iter(s3)
print(it)
# <iterator object at 0x000001C5379615F8>
print(next(it))
# Pig
print(next(it))
# and
print(next(it))
# Pepper
next(it)
# TypeError: 'Sentence' object is not iterable
list(it)
# []
list(iter(s3))
# ['Pig', 'and', 'Pepper']
- 使用iter()函数构造迭代器,使用next函数使用迭代器
- 传入迭代器无法还原已经耗尽的迭代器。,只能再次调用iter函数重新构建迭代器。
6、迭代器的定义
迭代器是这样的对象,实现了无参数的__ next __方法,返回序列中的下一个元素,如果没有元素了,就抛出异常。Python中迭代器还实现了__ iter __方法,因此迭代器也可以迭代。