Python中collections.Counter()的具體使用
Counter類
Counter類的目的是用來跟蹤值出現的次數。它是一個無序的容器類型,以字典的鍵值對形式存儲,其中元素作為key,其計數作為value。計數值可以是任意的Interger(包括0和負數)。Counter類和其他語言的bags或multisets很相似。
創建
Counter是一個容器對象,主要的作用是用來統計散列對象,可以使用三種方式來初始化
- 參數裡面參數可迭代對象 Counter(“success”)
- 傳入關鍵字參數 Counter((s=3,c=2,e=1,u=1))
- 傳入字典 Counter({“s”:3,”c”=2,”e”=1,”u”=1})
下面的代碼說明瞭Counter類創建的方法:
>>> c = Counter() # 創建一個空的Counter類 >>> c = Counter('gallahad') # 從一個可iterable對象(list、tuple、dict、字符串等)創建 >>> c = Counter({'a': 4, 'b': 2}) # 從一個字典對象創建 >>> c = Counter(a=4, b=2) # 從一組鍵值對創建
計數值的訪問與缺失的鍵
當所訪問的鍵不存在時,返回0,而不是KeyError;否則返回它的計數。
>>> c = Counter("abcdefgab") >>> c["a"] > 2 >>> c["c"] > 1 >>> c["h"] > 0
計數器的更新
可以使用一個iterable對象或者另一個Counter對象來更新鍵值。
計數器的更新包括增加和減少兩種。
增加使用update()方法:
>>> c = Counter('which') >>> c.update('witch') # 使用另一個iterable對象更新 >>> c['h'] > 2 >>> d = Counter('watch') >>> c.update(d) # 使用另一個Counter對象更新 >>> c['h'] > 3
減少則使用subtract()方法:
>>> c = Counter('which') >>> c.subtract('witch') # 使用另一個iterable對象更新 >>> c['h'] > 1 >>> d = Counter('watch') >>> c.subtract(d) # 使用另一個Counter對象更新 >>> c['a'] > -1
鍵的刪除
當計數值為0時,並不意味著元素被刪除,刪除元素應當使用del。
>>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> c["b"] = 0 >>> c Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0}) >>> del c["a"] >>> c Counter({'c': 2, 'b': 2, 'd': 1})
elements()
返回一個迭代器。
元素被重復瞭多少次,在該迭代器中就包含多少個該元素。元素排列無確定順序,個數小於1的元素不被包含。
>>> c = Counter(a=4, b=2, c=0, d=-2) >>> list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']
most_common([n])
返回一個TopN列表。如果n沒有被指定,則返回所有元素。當多個元素計數值相同時,排列是無確定順序的。
>>> c = Counter('abracadabra') >>> c.most_common() [('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)] >>> c.most_common(3) [('a', 5), ('r', 2), ('b', 2)]
fromkeys
未實現的類方法。
淺拷貝copy
>>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> d = c.copy() >>> d Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1})
算術和集合操作
+、-、&、|操作也可以用於Counter。其中&和|操作分別返回兩個Counter對象各元素的最小值和最大值。需要註意的是,得到的Counter對象將刪除小於1的元素。
>>> c = Counter(a=3, b=1) >>> d = Counter(a=1, b=2) >>> c + d # c[x] + d[x] Counter({'a': 4, 'b': 3}) >>> c - d # subtract(隻保留正數計數的元素) Counter({'a': 2}) >>> c & d # 交集: min(c[x], d[x]) Counter({'a': 1, 'b': 1}) >>> c | d # 並集: max(c[x], d[x]) Counter({'a': 3, 'b': 2})
常用操作
下面是一些Counter類的常用操作,來源於Python官方文檔。
sum(c.values()) # 所有計數的總數 c.clear() # 重置Counter對象,註意不是刪除 list(c) # 將c中的鍵轉為列表 set(c) # 將c中的鍵轉為set dict(c) # 將c中的鍵值對轉為字典 c.items() # 轉為(elem, cnt)格式的列表 Counter(dict(list_of_pairs)) # 從(elem, cnt)格式的列表轉換為Counter類對象 c.most_common()[:-n:-1] # 取出計數最少的n個元素 c += Counter() # 移除0和負值
到此這篇關於Python中collections.Counter()的具體使用的文章就介紹到這瞭,更多相關Python collections.Counter()內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python 中的 Counter 模塊及使用詳解(搞定重復計數)
- 5種Python統計次數方法技巧
- Python的collections模塊真的很好用
- Python中非常好用的內置函數詳解
- 4種非常實用的python內置數據結構