Python中range函數的基本用法完全解讀

前言

迭代器是 23 種設計模式中最常用的一種(之一),在 Python 中隨處可見它的身影,我們經常用到它,但是卻不一定意識到它的存在。在關於迭代器的系列文章中(鏈接見文末),我至少提到瞭 23 種生成迭代器的方法。有些方法是專門用於生成迭代器的,還有一些方法則是為瞭解決別的問題而“暗中”使用到迭代器。

在系統學習迭代器之前,我一直以為 range() 方法也是用於生成迭代器的,現在卻突然發現,它生成的隻是可迭代對象,而並不是迭代器! (PS:Python2 中 range() 生成的是列表,本文基於Python3,生成的是可迭代對象)

於是,我有瞭這樣的疑問:為什麼 range() 不生成迭代器呢?在查找答案的過程中,我發現自己對 range 類型的認識存在一些誤區。因此,本文將和大傢全面地認識一下 range ,期待與你共同學習進步。

1、range() 是什麼?

它的語法:range(start, stop [,step]) ;start 指的是計數起始值,默認是 0;stop 指的是計數結束值,但不包括 stop ;step 是步長,默認為 1,不可以為 0 。range() 方法生成一段左閉右開的整數范圍。

>>> a = range(5)  # 即 range(0,5)
>>> a
range(0, 5)
>>> len(a)
5
>>> for x in a:
>>>     print(x,end=" ")
0 1 2 3 4

對於 range() 函數,有幾個註意點:(1)它表示的是左閉右開區間;(2)它接收的參數必須是整數,可以是負數,但不能是浮點數等其它類型;(3)它是不可變的序列類型,可以進行判斷元素、查找元素、切片等操作,但不能修改元素;(4)它是可迭代對象,卻不是迭代器。

# (1)左閉右開
>>> for i in range(3, 6):
>>>     print(i,end=" ")
3 4 5
 
# (2)參數類型
>>> for i in range(-8, -2, 2):
>>>     print(i,end=" ")
-8 -6 -4
>>> range(2.2)
----------------------------
TypeError    Traceback (most recent call last)
...
TypeError: 'float' object cannot be interpreted as an integer
 
# (3)序列操作
>>> b = range(1,10)
>>> b[0]
1
>>> b[:-3]
range(1, 7)
>>> b[0] = 2
TypeError  Traceback (most recent call last)
...
TypeError: 'range' object does not support item assignment
 
# (4)不是迭代器
>>> hasattr(range(3),'__iter__')
True
>>> hasattr(range(3),'__next__')
False
>>> hasattr(iter(range(3)),'__next__')
True

2、 為什麼range()不生產迭代器?

可以獲得迭代器的內置方法很多,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,但是像 range() 這樣僅僅得到的是可迭代對象的方法就絕無僅有瞭(若有反例,歡迎告知)。這就是我存在知識誤區的地方。

在 for-循環 遍歷時,可迭代對象與迭代器的性能是一樣的,即它們都是惰性求值的,在空間復雜度與時間復雜度上並無差異。我曾概括過兩者的差別是“一同兩不同”:相同的是都可惰性迭代,不同的是可迭代對象不支持自遍歷(即next()方法),而迭代器本身不支持切片(即__getitem__() 方法)。

雖然有這些差別,但很難得出結論說它們哪個更優。現在微妙之處就在於,為什麼給 5 種內置方法都設計瞭迭代器,偏偏給 range() 方法設計的就是可迭代對象呢?把它們都統一起來,不是更好麼?

事實上,Pyhton 為瞭規范性就幹過不少這種事,例如,Python2 中有 range() 和 xrange() 兩種方法,而 Python3 就幹掉瞭其中一種,還用瞭“李代桃僵”法。為什麼不更規范點,令 range() 生成的是迭代器呢?

關於這個問題,我沒找到官方解釋,以下純屬個人觀點 。

zip() 等方法都需要接收確定的可迭代對象的參數,是對它們的一種再加工的過程,因此也希望馬上產出確定的結果來,所以 Python 開發者就設計瞭這個結果是迭代器。這樣還有一個好處,即當作為參數的可迭代對象發生變化的時候,作為結果的迭代器因為是消耗型的,不會被錯誤地使用。

而 range() 方法就不同瞭,它接收的參數不是可迭代對象,本身是一種初次加工的過程,所以設計它為可迭代對象,既可以直接使用,也可以用於其它再加工用途。例如,zip() 等方法就完全可以接收 range 類型的參數。

>>> for i in zip(range(1,6,2), range(2,7,2)):
>>>    print(i, end="")
(1, 2)(3, 4)(5, 6)

也就是說,range() 方法作為一種初級生產者,它生產的原料本身就有很大用途,早早把它變為迭代器的話,無疑是一種畫蛇添足的行為。

對於這種解讀,你是否覺得有道理呢?歡迎就這個話題與我探討。

3、range 類型是什麼?

以上是我對“為什麼range()不產生迭代器”的一種解答。順著這個思路,我研究瞭一下它產生的 range 對象,一研究就發現,這個 range 對象也並不簡單。

首先奇怪的一點就是,它竟然是不可變序列!我從未註意過這一點。雖然說,我從未想過修改 range() 的值,但這一不可修改的特性還是令我驚訝。

翻看文檔,官方是這樣明確劃分的——有三種基本的序列類型:列表、元組和范圍(range)對象。(There are three basic sequence types: lists, tuples, and range objects.)  

這我倒一直沒註意,原來 range 類型居然跟列表和元組是一樣地位的基礎序列!我一直記掛著字符串是不可變的序列類型,不曾想,這裡還有一位不可變的序列類型呢。

那 range 序列跟其它序列類型有什麼差異呢?

普通序列都支持的操作有 12 種。range 序列隻支持其中的 10 種,不支持進行加法拼接與乘法重復。

>>> range(2) + range(3)
-----------------------------------------
TypeError  Traceback (most recent call last)
...
TypeError: unsupported operand type(s) for +: 'range' and 'range'
 
>>> range(2)*2
-----------------------------------------
TypeError  Traceback (most recent call last)
...
TypeError: unsupported operand type(s) for *: 'range' and 'int'

那麼問題來瞭:同樣是不可變序列,為什麼字符串和元組就支持上述兩種操作,而偏偏 range 序列不支持呢?雖然不能直接修改不可變序列,但我們可以將它們拷貝到新的序列上進行操作啊,為何 range 對象連這都不支持呢?

且看官方文檔的解釋:

…due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.

原因是 range 對象僅僅表示一個遵循著嚴格模式的序列,而重復與拼接通常會破壞這種模式…

問題的關鍵就在於 range 序列的 pattern,仔細想想,其實它表示的就是一個等差數列啊(喵,高中數學知識沒忘…),拼接兩個等差數列,或者重復拼接一個等差數列,想想確實不妥,這就是為啥 range 類型不支持這兩個操作的原因瞭。由此推論,其它修改動作也會破壞等差數列結構,所以統統不給修改就是瞭。

4、小結

回顧全文,我得到瞭兩個偏冷門的結論:range 是可迭代對象而不是迭代器;range 對象是不可變的等差序列。

若單純看結論的話,你也許沒有感觸,或許還會說這沒啥瞭不得啊。但如果我追問,為什麼 range 不是迭代器呢,為什麼 range 是不可變序列呢?對這倆問題,你是否還能答出個自圓其說的設計思想呢?(PS:我決定瞭,若有機會面試別人,我必要問這兩個問題的嘿~)

由於 range 對象這細微而有意思的特性,我覺得這篇文章寫得值瞭。本文是作為迭代器系列文章的一篇來寫的,所以對於迭代器的基礎知識介紹不多,另外,還有一種特殊的迭代器也值得單獨成文,那就是生成器瞭。

附:Python的range()函數的歷史

雖然Python 2中的range()和Python 3中的range()可能共享一個名稱,但它們是完全不同的動物。實際上,Python 3中的range()隻是Python 2中稱為xrange的函數的重命名版本。

最初,range()和xrange()都生成瞭可以用for循環遍歷的數字,但是前者一次生成瞭所有這些數字的列表,而後者則懶惰地生成數字,這意味著需要時每次返回一個數字。

掛起巨大的列表會占用內存,所以xrange()替換range()、名稱和所有內容也就不足為奇瞭。您可以在PEP 3100中閱讀關於這個決定和xrange() vs range()背景的更多信息。

註:PEP代表Python增強建議。pep是能夠涵蓋廣泛主題的文檔,包括建議的新特性、樣式、治理和哲學。

有很多。PEP 1解釋瞭它們是如何工作的,是一個很好的起點。

總結

到此這篇關於Python中range函數基本用法的文章就介紹到這瞭,更多相關Python中range函數用法內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: