pandas數值排序的實現實例

本文用到的表格內容如下:

排序前先來看一下原始情形:

import pandas as pd
​
df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df)

result:
   姓名     年齡  成績
0  小明   23.0  78
1  小剛    NaN  89
2  小紅  876.0  65
3  李華   65.0  89
4  小美    NaN  43
5  張三   34.0  90
6  李四    NaN  34
7  王五   98.5  87

1.按照一列數值進行排序

按照某一列數值進行排序就是整個數據表都要以某一列為準,進行升序或降序
排序需要用到sort_values()方法,在sort_values()方法中要通過by參數指明要排序的列名,通過ascending參數知名升序還是降序。

1.1按照五缺失值的一列進行排序

1.1.1升序排列

該方法默認升序排列(即ascending參數的默認值是True),使用by參數用來指定需要排序的列名

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績"]))

result:
   姓名     年齡  成績
6  李四    NaN  34
4  小美    NaN  43
2  小紅  876.0  65
0  小明   23.0  78
7  王五   98.5  87
1  小剛    NaN  89
3  李華   65.0  89
5  張三   34.0  90

1.1.2 降序排列

隻要設置ascending參數的值為False,即可實現降序排列

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績"], ascending=False))

result:
   姓名     年齡  成績
5  張三   34.0  90
1  小剛    NaN  89
3  李華   65.0  89
7  王五   98.5  87
0  小明   23.0  78
2  小紅  876.0  65
4  小美    NaN  43
6  李四    NaN  34

1.2按照有缺失值的一列進行排序

當待排序的列中有缺失值時,可以通過設置na_position參數對缺失值的顯示位置進行設置

1.2.1 缺失值顯示在最後

該方法默認缺失值顯示在最後(na_position參數的默認值是last)

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績"]))

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["年齡"]))

result:
   姓名     年齡  成績
0  小明   23.0  78
5  張三   34.0  90
3  李華   65.0  89
7  王五   98.5  87
2  小紅  876.0  65
1  小剛    NaN  89
4  小美    NaN  43
6  李四    NaN  34

1.2.2 缺失值顯示在最前面

隻要設置na_position參數的值為first,即可實現缺失值顯示在最前面

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["年齡"], na_position='first'))

result:
   姓名     年齡  成績
1  小剛    NaN  89
4  小美    NaN  43
6  李四    NaN  34
0  小明   23.0  78
5  張三   34.0  90
3  李華   65.0  89
7  王五   98.5  87
2  小紅  876.0  65

2.按照多列數值進行排序

按照多列數值排序是指同時依據多列數據進行升序、降序排列。當第一列出現重復值時按照第二列進行排序,第二列出現重復值時按照第三列進行排序,依次類推。
此時在sort_values()方法中需要排序的多個列名要以列表的形式傳遞給by參數,需要每個排序的列名所對應的排序方式也要以列表的形式傳遞給ascending參數,二者的列表要一一對應。

df = pd.read_excel(r'C:\Users\admin\Desktop\測試.xlsx')
print(df.sort_values(by=["成績", "年齡"], ascending=[True, False]))

result:
   姓名     年齡  成績
6  李四    NaN  34
4  小美    NaN  43
2  小紅  876.0  65
0  小明   23.0  78
7  王五   98.5  87
3  李華   65.0  89
1  小剛    NaN  89
5  張三   34.0  90

此時按照成績進行升序排列,當成績相同時再按照年齡進行降序排列。

到此這篇關於pandas數值排序的實現實例的文章就介紹到這瞭,更多相關pandas數值排序內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: