Pandas統計計數value_counts()的使用
value_counts()方法返回一個序列Series,該序列包含每個值的數量(對於數據框中的任何列,value_counts()方法會返回該列每個項的計數)
value_counts()是Series擁有的方法,一般在DataFrame中使用時,需要指定對哪一列進行使用
語法
value_counts(values, sort=True, ascending=False, normalize=False, bins=None, dropna=True)
參數說明
- sort: 是否要進行排序(默認進行排序,取值為True)
- ascending: 默認降序排序(取值為False),升序排序取值為True
- normalize: 是否要對計算結果進行標準化,並且顯示標準化後的結果,默認是False
- bins: 可以自定義分組區間,默認是否
- dropna: 是否包括對NaN進行計數,默認不包括
import pandas as pd import numpy as np df = pd.DataFrame({'City': ['北京', '廣州', '深圳', '上海', '大連', '成都', '深圳', '廈門', '北京', '北京', '上海', '珠海'], 'Revenue': [10000, 10000, 5000, 5000, 40000, 50000, 8000, 5000, 5000, 5000, 10000, 12000], 'Age': [50, 43, 34, 40, 25, 25, 45, 32, 25, 25, 34, np.nan]}) # 1.查看'City'這一列的計數結果(對給定列裡面的每個值進行計數並進行降序排序,缺失值nan也會被排除) # value_counts()並不是未帶任何參數,而是所有參數都是默認的 res1 = df['City'].value_counts() # 2.查看'Revenue'這一列的計數結果(采用升序的方式) res2 = df['Revenue'].value_counts(ascending=True) # 3.查看'Age'這一列的計數占比(使用標準化normalize=True) res3 = df['Age'].value_counts(ascending=True,normalize=True) # 4.查看'Age'這一列的計數結果(展示NaN值的計數) res4 = df['Age'].value_counts(dropna=False) # 5.查看'Age'這一列的計數結果(不展示NaN值的計數) # res5 = df['Age'].value_counts() res5 = df['Age'].value_counts(dropna=True)
df
res1
res2
res3
res4
res5
到此這篇關於Pandas統計計數value_counts()的使用的文章就介紹到這瞭,更多相關Pandas統計計數value_counts()內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python機器學習三大件之二pandas
- Pandas對數值進行分箱操作的4種方法總結
- pandas實現按照多列排序-ascending
- Pandas數值排序 sort_values()的使用
- python數據處理67個pandas函數總結看完就用