pandas實現按照多列排序-ascending

pandas按照多列排序ascending

代碼示例:

import pandas as pd
 
#讀取文件
df = pd.read_csv('./TianQi.csv')
#字符串替換和類型轉換
df['最高溫度'] = df['最高溫度'].str.replace('℃','').astype('int32')
df.loc[:,'最低溫度'] = df['最低溫度'].str.replace('℃','').astype('int32')
#排序並獲取最高溫度前5名
print(df.sort_values(by='最高溫度',ascending=False).head())
'''
打印:
            日期  最高溫度  最低溫度      天氣   風向  風級 空氣質量
184   2019/7/4    38    25    晴~多雲  西南風  2級    良
206  2019/7/26    37    27       晴  西南風  2級    良
142  2019/5/23    37    21       晴  東南風  2級    良
183   2019/7/3    36    24       晴  東南風  1級    良
204  2019/7/24    36    27  多雲~雷陣雨  西南風  2級    良
'''
 
#按照多列排序
print(df.sort_values(by=['最高溫度','最低溫度'],ascending= True).head(10))
'''
打印:
             日期  最高溫度  最低溫度     天氣   風向  風級 空氣質量
363  2019/12/30    -5   -12      晴  西北風  4級    優
364  2019/12/31    -3   -10      晴  西北風  1級    優
42    2019/2/12    -3    -8  小雪~多雲  東北風  2級    優
44    2019/2/14    -3    -6  小雪~多雲  東南風  2級    良
14    2019/1/15    -2   -10      晴  西北風  3級    良
37     2019/2/7    -2    -7     多雲  東北風  3級    優
38     2019/2/8    -1    -7     多雲  西南風  2級    優
4      2019/1/5     0    -8     多雲  東北風  2級    優
39     2019/2/9     0    -8     多雲  東北風  2級    優
40    2019/2/10     0    -8     多雲  東南風  1級    優
'''
print(df.sort_values(by=['最高溫度','最低溫度'],ascending= False).head(10))
'''
打印:
           日期  最高溫度  最低溫度      天氣   風向  風級  空氣質量
184   2019/7/4    38    25    晴~多雲  西南風  2級     良
206  2019/7/26    37    27       晴  西南風  2級     良
142  2019/5/23    37    21       晴  東南風  2級     良
201  2019/7/21    36    27    晴~多雲  西南風  2級  輕度污染
204  2019/7/24    36    27  多雲~雷陣雨  西南風  2級     良
207  2019/7/27    36    27      多雲  東南風  2級  輕度污染
174  2019/6/24    36    24      多雲  東南風  2級     良
175  2019/6/25    36    24      多雲  東南風  2級     良
183   2019/7/3    36    24       晴  東南風  1級     良
170  2019/6/20    36    23    多雲~晴  東南風  2級  輕度污染
'''
print(df.sort_values(by=['最高溫度','最低溫度'],ascending= [True,False]).head(10))
'''
打印:
             日期  最高溫度  最低溫度     天氣   風向  風級 空氣質量
363  2019/12/30    -5   -12      晴  西北風  4級    優
44    2019/2/14    -3    -6  小雪~多雲  東南風  2級    良
42    2019/2/12    -3    -8  小雪~多雲  東北風  2級    優
364  2019/12/31    -3   -10      晴  西北風  1級    優
37     2019/2/7    -2    -7     多雲  東北風  3級    優
14    2019/1/15    -2   -10      晴  西北風  3級    良
38     2019/2/8    -1    -7     多雲  西南風  2級    優
4      2019/1/5     0    -8     多雲  東北風  2級    優
39     2019/2/9     0    -8     多雲  東北風  2級    優
40    2019/2/10     0    -8     多雲  東南風  1級    優
'''

pandas排序、排名函數的使用

排序

Series

s.sort_index(ascending=False)

對series的索引進行排序,默認升序

s.sort_values(ascending=False)

對series的值進行排序,對值進行排序的時候,無論是升序還是降序,缺失值(NaN)都會排在最後面

DataFrame:

dt.sort_index(ascending=False)#按列索引進行降序排序
dt.sort_inex(axis=1)#按行的索引進行排序
dt.sort_values(by='columns_name')#按指定列的值進行排序
dt.sort_values(by='row_name', axis=1)#按指定行的值進行排序

使用by參數進行某幾列(行)排序的時候,以列表中的第一個為準,可能後面的不會生效,因為有的時候無法做到既對第一行(列)進行升序排序又對第二行(列)進行排序。

在指定行值進行排序的時候,必須設置axis=1,不然會報錯,因為默認指定的是列索引,找不到這個索引所以報錯,axis=1的意思是指定行索引。
 

排名

Series

s.rank(method=‘first')

對series的值進行升序排名,輸出為排名,當排名相同時,輸出平均排名,method=‘first’排名相同時按照值在數組中出現的順序排序

method參數除瞭,first按值在原始數據中的出現順序分配排名,還有min使用整個分組的最小排名,max是用整個分組的最大排名,average使用平均排名,也是默認的排名方式。還可以設置ascending參數,設置降序還是升序排序。

DataFrame:

dt.rank()#按列進行排名 
dt.rank(axis=1)#按行進行排名

method與ascending參數的使用與Series的相同

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: