迭代器是可以迭代的对象。 在本教程中,您将学习迭代器的工作原理以及如何使用__iter__和__next__方法构建自己的迭代器。
迭代器在Python中无处不在。它们在for循环,理解,生成器等中优雅地实现,但却隐藏在眼皮底下。
Python中的Iterator只是一个可以迭代的对象。一个将返回数据的对象,一次返回一个元素。
从技术上讲,Python 迭代器对象必须实现两个特殊方法,__iter__()和__next__()统称为迭代器协议。
如果我们可以从对象获得迭代器,则该对象称为可迭代。Python中的大多数内置容器(例如:list,tuple,string等)都是可迭代的。
iter()函数(也就是__iter__()方法)从它们返回一个迭代器。
我们使用该next()函数手动遍历迭代器的所有项目。 当我们到达末尾并且没有更多数据要返回时,它将引发StopIteration。 以下是一个示例。。
# 定义一个列表 my_list = [4, 7, 0, 3] # 使用iter()获得迭代器 my_iter = iter(my_list) ## 使用iter()获得迭代器 #输出 4 print(next(my_iter)) #输出 7 print(next(my_iter)) ## next(obj)与obj .__ next __()相同 #输出 0 print(my_iter.__next__()) #输出 3 print(my_iter.__next__()) ## 这将引起错误,没有项目剩下 next(my_iter)
一种自动迭代的更优雅的方法是使用for循环。使用此方法,我们可以迭代可以返回迭代器的任何对象,例如列表,字符串,文件等。
>>> for element in my_list: ... print(element) ... 4 7 0 3
正如我们在上面的示例中看到的那样,for循环能够自动遍历列表。
实际上,for循环可以迭代任何可迭代的对象。让我们仔细看看如何for在Python中实际实现循环。
for element in iterable: # 对元素做点什么
实际上是实现为。
# 创建一个迭代器对象iterable iter_obj = iter(iterable) # 无限循环 while True: try: # 获取下一项 element = next(iter_obj) # 对元素做点什么 except StopIteration: # 如果引发StopIteration,则从循环中断 break
因此,在内部,for循环通过在iterable上调用iter()创建一个迭代器对象iter_obj。
具有讽刺意味的是,这个for循环实际上是一个无限的while循环。
在循环内部,它调用next()来获取下一个元素,并使用这个值执行for循环的主体。当所有的项都用完后,StopIteration被抛出,它在内部被捕获,循环结束。注意,任何其他类型的异常都会通过。
在Python中从头开始构建迭代器很容易。我们只需要实现这些方法__iter__()和__next__()。
__iter__()方法返回迭代器对象本身。如果需要,可以执行一些初始化。
__next__()方法必须返回序列中的下一项。在到达终点时,以及在随后的调用中,它必须引发StopIteration。
这里,我们展示了一个示例,它将在每次迭代中为我们提供2的次幂。幂指数从0到用户设置的数字。
class PowTwo: """实现迭代器的类 二的幂""" def __init__(self, max = 0): self.max = max def __iter__(self): self.n = 0 return self def __next__(self): if self.n <= self.max: result = 2 ** self.n self.n += 1 return result else: raise StopIteration
现在,我们可以创建一个迭代器,并如下进行迭代。
>>> a = PowTwo(4) >>> i = iter(a) >>> next(i) 1 >>> next(i) 2 >>> next(i) 4 >>> next(i) 8 >>> next(i) 16 >>> next(i) Traceback (most recent call last): ... StopIteration
我们还可以使用for循环来迭代迭代器类。
>>> for i in PowTwo(5): ... print(i) ... 1 2 4 8 16 32
迭代器对象中的项不必耗尽。可能有无限的迭代器(永远不会结束)。在处理这样的迭代器时,我们必须小心。
这是一个演示无限迭代器的简单示例。
iter()可以用两个参数调用,其中第一个参数必须是可调用对象(函数),第二个参数是标记。迭代器调用这个函数,直到返回的值等于标记值为止。
>>> int() 0 >>> inf = iter(int,1) >>> next(inf) 0 >>> next(inf) 0
我们可以看到int()函数始终返回0。因此,将其作为iter(int,1)传递将返回一个迭代器,该迭代器调用int()直到返回值等于1。这永远不会发生,并且我们得到一个无限迭代器。
我们还可以构建自己的无限迭代器。理论上,以下迭代器将返回所有奇数。
class InfIter: """无限迭代器返回所有 奇数""" def __iter__(self): self.num = 1 return self def __next__(self): num = self.num self.num += 2 return num
运行如下。
>>> a = iter(InfIter()) >>> next(a) 1 >>> next(a) 3 >>> next(a) 5 >>> next(a) 7
等等...
在这些类型的无限迭代器上进行迭代时,请小心包含终止条件。
使用迭代器的优点是节省了资源。如上所示,我们无需将整个数字系统存储在内存中就可以获得所有奇数。从理论上讲,我们可以在有限内存中包含无限项。
迭代器还使我们的代码看起来很酷。
有一种在Python中创建迭代器的简便方法。要了解更多信息,请访问:Python生成器yield。