Python中非常好用的內置函數詳解
Python中冷門但非常好用的內置函數 Counter舉例 實戰sortedallF-strings
Python中有許多內置函數,不像print、len那麼廣為人知,但它們的功能卻異常強大,用好瞭可以大大提高代碼效率,同時提升代碼的簡潔度,增強可閱讀性
Counter
collections在python官方文檔中的解釋是High-performance container datatypes,直接的中文翻譯解釋高性能容量數據類型。這個模塊實現瞭特定目標的容器,以提供Python標準內建容器 dict , list , set , 和 tuple的替代選擇。在python3.10.1中它總共包含以下幾種數據類型:
容器名 | 簡介 |
---|---|
namedtuple() | 創建命名元組子類的工廠函數 |
deque | 類似列表(list)的容器,實現瞭在兩端快速添加(append)和彈出(pop) |
ChainMap | 類似字典(dict)的容器類,將多個映射集合到一個視圖裡面 |
Counter | 字典的子類,提供瞭可哈希對象的計數功能 |
OrderedDict | 字典的子類,保存瞭他們被添加的順序 |
defaultdict | 字典的子類,提供瞭一個工廠函數,為字典查詢提供一個默認值 |
UserDict | 封裝瞭字典對象,簡化瞭字典子類化 |
UserList | 封裝瞭列表對象,簡化瞭列表子類化 |
UserString | 封裝瞭字符串對象,簡化瞭字符串子類化 |
其中Counter中文意思是計數器,也就是我們常用於統計的一種數據類型,在使用Counter之後可以讓我們的代碼更加簡單易讀。Counter類繼承dict類,所以它能使用dict類裡面的方法
舉例
#統計詞頻 fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach'] result = {} for fruit in fruits: if not result.get(fruit): result[fruit] = 1 else: result[fruit] += 1 print(result) #{'apple': 2, 'peach': 3, 'lemon': 1}
下面我們看用Counter怎麼實現
from collections import Counter fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach'] c = Counter(fruits) print(dict(c)) #{'apple': 2, 'peach': 3, 'lemon': 1}
顯然代碼更加簡單瞭,也更容易閱讀和維護瞭。
elements()
返回一個迭代器,其中每個元素將重復出現計數值所指定次。元素會按首次出現的順序返回。如果一個元素的計數值小於1,elements()將會忽略它。
>>> c = Counter(a=4, b=2, c=0, d=-2) >>> sorted(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']
most_common([n])
返回一個列表,其中包含n個最常見的元素及出現次數,按常見程度由高到低排序。如果n被省略或為None,most_common()將返回計數器中的所有元素。計數值相等的元素按首次出現的順序排序:
這兩個方法是Counter中最常用的方法,其他方法可以參考python3.10.1官方文檔
實戰
Leetcode 1002.查找共用字符
給你一個字符串數組words,請你找出所有在words的每個字符串中都出現的共用字符(包括重復字符),並以數組形式返回。你可以按任意順序返回答案。
輸入:words = ["bella", "label", "roller"] 輸出:["e", "l", "l"] 輸入:words = ["cool", "lock", "cook"] 輸出:["c", "o"]
看到統計字符,典型的可以用Counter完美解決。這道題是找出字符串列表裡面每個元素都包含的字符,首先可以用Counter計算出每個元素每個字符出現的次數,依次取交集最後得出所有元素共同存在的字符,然後利用elements輸出共用字符出現的次數
class Solution: def commonChars(self, words: List[str]) -> List[str]: from collections import Counter ans = Counter(words[0]) for i in words[1:]: ans &= Counter(i) return list(ans.elements())
提交一下,發現83個測試用例耗時48ms,速度還是不錯的
sorted
在處理數據過程中,我們經常會用到排序操作,比如將列表、字典、元組裡面的元素正/倒排序。這時候就需要用到sorted(),它可以對任何可迭代對象進行排序,並返回列表
對列表升序操作:
a = sorted([2, 4, 3, 7, 1, 9]) print(a) # 輸出:[1, 2, 3, 4, 7, 9]
對元組倒序操作:
sorted((4,1,9,6),reverse=True) print(a) # 輸出:[9, 6, 4, 1]
使用參數:key,根據自定義規則,按字符串長度來排序:
fruits = ['apple', 'watermelon', 'pear', 'banana'] a = sorted(fruits, key = lambda x : len(x)) print(a) # 輸出:['pear', 'apple', 'banana', 'watermelon']
all
all() 函數用於判斷給定的可迭代參數iterable中的所有元素是否都為 TRUE,如果是返回 True,否則返回 False。元素除瞭是 0、空、None、False外都算True。註意:空元組、空列表返回值為True。
>>> all(['a', 'b', 'c', 'd']) # 列表list,元素都不為空或0 True >>> all(['a', 'b', '', 'd']) # 列表list,存在一個為空的元素 False >>> all([0, 1,2, 3]) # 列表list,存在一個為0的元素 False >>> all(('a', 'b', 'c', 'd')) # 元組tuple,元素都不為空或0 True >>> all(('a', 'b', '', 'd')) # 元組tuple,存在一個為空的元素 False >>> all((0, 1, 2, 3)) # 元組tuple,存在一個為0的元素 False >>> all([]) # 空列表 True >>> all(()) # 空元組 True
any函數正好和all函數相反:判斷一個tuple或者list是否全為空,0,False。如果全為空,0,False,則返回False;如果不全為空,則返回True。
F-strings
在python3.6.2版本中,PEP 498提出一種新型字符串格式化機制,被稱為 “字符串插值” 或者更常見的一種稱呼是F-strings,F-strings提供瞭一種明確且方便的方式將python表達式嵌入到字符串中來進行格式化:
>>> all(['a', 'b', 'c', 'd']) # 列表list,元素都不為空或0 True >>> all(['a', 'b', '', 'd']) # 列表list,存在一個為空的元素 False >>> all([0, 1,2, 3]) # 列表list,存在一個為0的元素 False >>> all(('a', 'b', 'c', 'd')) # 元組tuple,元素都不為空或0 True >>> all(('a', 'b', '', 'd')) # 元組tuple,存在一個為空的元素 False >>> all((0, 1, 2, 3)) # 元組tuple,存在一個為0的元素 False >>> all([]) # 空列表 True >>> all(()) # 空元組 True
在F-strings中我們也可以執行函數:
def power(x): return x*x x=4 print(f'{x} * {x} = {power(x)}') # 4 * 4 = 16
而且F-strings
的運行速度很快,比傳統的%-string
和str.format()
這兩種格式化方法都快得多,書寫起來也更加簡單。
總結
本篇文章就到這裡瞭,希望能夠給你帶來幫助,也希望您能夠多多關註WalkonNet的更多內容!
推薦閱讀:
- Python 中的 Counter 模塊及使用詳解(搞定重復計數)
- 5種Python統計次數方法技巧
- Python中collections.Counter()的具體使用
- 4種非常實用的python內置數據結構
- python進階從青銅到王者一定會用上的Python技巧