一文搞懂python 中的迭代器和生成器
可迭代對象和迭代器
迭代(iterate)意味著重復,就像 for 循環迭代序列和字典那樣,但實際上也可使用 for 循環迭代其他對象:實現瞭方法 __iter__ 的對象(迭代器協議的基礎)。
__iter__方法返回一個迭代器,它是包含方法 __next__ 的對象,調用時可不提供任何參數;
當你調用 __next__ 時,迭代器應返回其下一個值;如果沒有可供返回的值,應引發 StopIteration 異常;
也可使用內置函數 next(),此種情況下,next(it) 與 it.__next()__ 等效。
至於為什麼不用列表?因為在很多情況下,使用列表都有點太浪費瞭。例如,如果你有一個可逐個計算值的函數,你可能隻想逐個地獲取值,而不是使用列表一次性獲取。這是因為如果有很多值,列表可能占用太多的內存。
下面來看一個不能使用列表的示例,因為如果使用,這個列表的長度將是無窮大的!
# 這個“列表”為斐波那契數列,表示該數列的迭代器如下: class Fibs: def __init__(self): self.a = 0 self.b = 1 def __next__(self): self.a, self.b = self.b, self.a + self.b return self.a # 前面邏輯自定義,最後返回下一個值即可 def __iter__(self): return self # 返回迭代器本身(一個包含 __next__ 方法的對象) fibs = Fibs() for f in fibs: if f > 1000: print(f) # 1597 break # 若不中斷循環,將一直循環下去 next(fibs) # 2584 next(fibs) # 4181
更正規的定義是,實現瞭方法 __iter__ 的對象是 可迭代的,再實現瞭方法 __next__ 的對象是 迭代器。
內置函數 iter()
通過對可迭代對象調用內置函數 iter(),可以獲得一個迭代器。還可使用它從函數或其他可調用對象創建可迭代對象。
不過,可迭代對象在轉化為迭代器後,會丟失⼀些屬性(如 __getitem__() ),但同時也會增加⼀些屬性(如 __next__() )。
另外,迭代器一般都是⼀次性的,當迭代過⼀輪後,再次迭代將獲取不到元素;而可迭代對象可以重復使用。
it = iter([1, 2, 3]) # list 是可迭代對象哦 next(it) # 1 next(it) # 2 next(it) # 3 next(it) # StopIretation; 普通的可迭代對象是可復用的,而迭代器是一次性的,回不瞭頭的 it = iter("ABCD") # string 也是可迭代對象 for i in it: print(i, end=" ") # A B C D for i in it: print(i, end=" ") # ⽆輸出
查看對象是否實現瞭魔法方法 _iter_ 的四種方法:
# ⽅法1:dir()查看__iter__,詳情請自己嘗試 dir(2) # 沒有 dir("abc") # 有 __iter__() # ⽅法2:isinstance()判斷 import collections isinstance(2, collections.Iterable) # False isinstance("abc", collections.Iterable) # True # ⽅法3:hasattr()判斷 hasattr(2,"__iter__") # False hasattr("abc","__iter__") # True # ⽅法4:⽤iter()查看是否報錯 iter(2) # 報錯:'int' object is not iterable iter("abc") # <str_iterator at 0x1e2396d8f28>
從迭代器創建序列
在可以使用序列的情況下,大多也可以使用迭代器或可迭代對象(諸如索引和切片等操作除外)。迭代器因為缺少 __getitem__ ,因此不能使⽤普通的切⽚語法,暫未深究。
# 使用構造函數 list() 顯示的將迭代器轉換為列表 class TestIterator: value = 0 def __next__(self): self.value += 1 if self.value > 10: raise StopIteration return self.value def __iter__(self): return self ti = TestIterator() ti2 = list(ti) # [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] for i in ti2: print(i, end=" ") # 1 2 3 4 5 6 7 8 9 10 print('the second:')
生成器
生成器,也被稱為簡單生成器(simple generator),生成器自動創建瞭 iter() 和 next() 方法,是一種使用普通函數語法定義的迭代器
。與函數的主要的形式差別就在於,它的函數體中有一句 yield 語句。
每次執行到 yield 處時,生成並返回一個值後,函數都將暫時停止執行,等待下一輪迭代調用,如此往復,直到迭代完。數據量大時,生成器能夠極大地節省內存空間。下面還是通過斐波納契數列來看看:
# 斐波納契數列的生成器實現: 返回數列的前 n 項 def fibs(n): a, b = 0, 1 for _ in range(n): yield a # 返回的是一個生成器 a, b = b, b+a f = fibs(5) print(f) # <generator object fibs at 0x05BB20B0> print(list(f)) # [0, 1, 1, 2, 3]; 此處生成器 f 已經被迭代過一次瞭 for i in f: print(i, end=" ") # ⽆輸出; for循環會⾃動捕捉到 StopIteration 異常並停⽌調⽤ next() print(next(f)) # StopIteration
與 return 的區別:生成器不是像 return 一樣返回一個值,而是可以生成多個值,每次返回一個;return 返回的話,這個函數就結束瞭。
生成器推導(生成式表達式)
將列表生成式的 [] 改成 () 之後,數據結構將從列表變為生成器,而不是元組。如果要包裝可迭代對象(可能生成大量的值)時,若使用列表推導將立即實例化一個列表,從而喪失迭代的優勢;但如果使用生成器推導的話,每迭代一次就生成一個值,沒必要一次性生成全部值,這樣就好的多瞭。而且,可以直接在既有的圓括號內(如在函數調用中)使用生成器推導時,無需再添加一對圓括號。
L = [x*x for x in range(10)] # [0, 1, 4, 9, 16, 25, 36, 49, 64, 81] g = (x*x for x in range(10)) # <generator object <genexpr> at 0x052AF8F0> print(next(g)) # 0 sum(i ** 2 for i in range(10)) # 285
遞歸式生成器
創建一個將兩層嵌套列表展開的函數:
nested = [[1, 2], [3, 4], [5], 6] def flatten(nested): try: for sub in nested: for ele in sub: yield ele except TypeError: yield sub f = flatten(nested) next(f) # 1 # print(list(f)) # [2, 3, 4, 5, 6] for i in f3: print(i) # 2 3 4 5 6
創建一個將任意層嵌套列表展開的函數:
對一層列表進行遍歷,遍歷下層列表的時候,先對一層遍歷出來的元素再調用一次 flatten 函數,這時,如果是不可再迭代的對象的話,就會報 TypeError 錯誤,捕捉到之後,yeild 返回,繼續下一個;如果是可迭代的話,就遞歸下去;
def flatten(nested): try: for sub in nested: for ele in flatten(sub): yield ele except TypeError: yield nested nested = [[[1], 2], 3, 4, [5, [6, 7]], 8] print(list(flatten(nested)))
不過,上面要註意的是:前面也提到瞭,字符串對象也是可迭代的,而且一般我們也不會將它拆開。更重要的是,字符串的第一個元素是一個長度為 1 的字符串,而長度為 1 的字符串的第一個元素是字符串本身。
s = 'ABCD' s2 = s[0] # 'A' s2[0] # 'A'
這樣子會造成無窮遞歸的。所以還需要檢查一下對象是否類似於字符串:
def flatten(nested): try: if isinstance(nested, str): raise TypeError for sub in nested: for ele in flatten(sub): yield ele except TypeError: yield nested nested = [[[1], '23'], 3, '43', [5, [6, '73']], 8] print(list(flatten(nested))) # [1, '23', 3, '43', 5, 6, '73', 8]
不過,它有兩個 yield 唉,這認哪個來著???pass
def flatten(nested): try: for sublist in nested: for element in flatten(sublist): print("element:", element) yield element except TypeError: print("nested :", nested) yield nested print(list(flatten([[1, 2], [3, 4], [5], 6])))
輸出:
nested : 1
element: 1
nested : 2
element: 2
nested : 3
element: 3
nested : 4
element: 4
nested : 5
element: 5
nested : 6
element: 6
[1, 2, 3, 4, 5, 6]
到此這篇關於python 中的迭代器和生成器簡單介紹的文章就介紹到這瞭,更多相關python 迭代器和生成器內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python淺析迭代器Iterator的使用
- Python生成器與迭代器詳情
- Python高級特性之切片迭代列表生成式及生成器詳解
- 一篇文章帶你學習Python3的高級特性(2)
- 正確理解python迭代器與生成器