pandas實現按照多列排序-ascending
pandas按照多列排序ascending
代碼示例:
import pandas as pd #讀取文件 df = pd.read_csv('./TianQi.csv') #字符串替換和類型轉換 df['最高溫度'] = df['最高溫度'].str.replace('℃','').astype('int32') df.loc[:,'最低溫度'] = df['最低溫度'].str.replace('℃','').astype('int32') #排序並獲取最高溫度前5名 print(df.sort_values(by='最高溫度',ascending=False).head()) ''' 打印: 日期 最高溫度 最低溫度 天氣 風向 風級 空氣質量 184 2019/7/4 38 25 晴~多雲 西南風 2級 良 206 2019/7/26 37 27 晴 西南風 2級 良 142 2019/5/23 37 21 晴 東南風 2級 良 183 2019/7/3 36 24 晴 東南風 1級 良 204 2019/7/24 36 27 多雲~雷陣雨 西南風 2級 良 ''' #按照多列排序 print(df.sort_values(by=['最高溫度','最低溫度'],ascending= True).head(10)) ''' 打印: 日期 最高溫度 最低溫度 天氣 風向 風級 空氣質量 363 2019/12/30 -5 -12 晴 西北風 4級 優 364 2019/12/31 -3 -10 晴 西北風 1級 優 42 2019/2/12 -3 -8 小雪~多雲 東北風 2級 優 44 2019/2/14 -3 -6 小雪~多雲 東南風 2級 良 14 2019/1/15 -2 -10 晴 西北風 3級 良 37 2019/2/7 -2 -7 多雲 東北風 3級 優 38 2019/2/8 -1 -7 多雲 西南風 2級 優 4 2019/1/5 0 -8 多雲 東北風 2級 優 39 2019/2/9 0 -8 多雲 東北風 2級 優 40 2019/2/10 0 -8 多雲 東南風 1級 優 ''' print(df.sort_values(by=['最高溫度','最低溫度'],ascending= False).head(10)) ''' 打印: 日期 最高溫度 最低溫度 天氣 風向 風級 空氣質量 184 2019/7/4 38 25 晴~多雲 西南風 2級 良 206 2019/7/26 37 27 晴 西南風 2級 良 142 2019/5/23 37 21 晴 東南風 2級 良 201 2019/7/21 36 27 晴~多雲 西南風 2級 輕度污染 204 2019/7/24 36 27 多雲~雷陣雨 西南風 2級 良 207 2019/7/27 36 27 多雲 東南風 2級 輕度污染 174 2019/6/24 36 24 多雲 東南風 2級 良 175 2019/6/25 36 24 多雲 東南風 2級 良 183 2019/7/3 36 24 晴 東南風 1級 良 170 2019/6/20 36 23 多雲~晴 東南風 2級 輕度污染 ''' print(df.sort_values(by=['最高溫度','最低溫度'],ascending= [True,False]).head(10)) ''' 打印: 日期 最高溫度 最低溫度 天氣 風向 風級 空氣質量 363 2019/12/30 -5 -12 晴 西北風 4級 優 44 2019/2/14 -3 -6 小雪~多雲 東南風 2級 良 42 2019/2/12 -3 -8 小雪~多雲 東北風 2級 優 364 2019/12/31 -3 -10 晴 西北風 1級 優 37 2019/2/7 -2 -7 多雲 東北風 3級 優 14 2019/1/15 -2 -10 晴 西北風 3級 良 38 2019/2/8 -1 -7 多雲 西南風 2級 優 4 2019/1/5 0 -8 多雲 東北風 2級 優 39 2019/2/9 0 -8 多雲 東北風 2級 優 40 2019/2/10 0 -8 多雲 東南風 1級 優 '''
pandas排序、排名函數的使用
排序
Series
s.sort_index(ascending=False)
對series的索引進行排序,默認升序
s.sort_values(ascending=False)
對series的值進行排序,對值進行排序的時候,無論是升序還是降序,缺失值(NaN)都會排在最後面
DataFrame:
dt.sort_index(ascending=False)#按列索引進行降序排序 dt.sort_inex(axis=1)#按行的索引進行排序 dt.sort_values(by='columns_name')#按指定列的值進行排序 dt.sort_values(by='row_name', axis=1)#按指定行的值進行排序
使用by參數進行某幾列(行)排序的時候,以列表中的第一個為準,可能後面的不會生效,因為有的時候無法做到既對第一行(列)進行升序排序又對第二行(列)進行排序。
在指定行值進行排序的時候,必須設置axis=1,不然會報錯,因為默認指定的是列索引,找不到這個索引所以報錯,axis=1的意思是指定行索引。
排名
Series
s.rank(method=‘first')
對series的值進行升序排名,輸出為排名,當排名相同時,輸出平均排名,method=‘first’排名相同時按照值在數組中出現的順序排序
method參數除瞭,first按值在原始數據中的出現順序分配排名,還有min使用整個分組的最小排名,max是用整個分組的最大排名,average使用平均排名,也是默認的排名方式。還可以設置ascending參數,設置降序還是升序排序。
DataFrame:
dt.rank()#按列進行排名 dt.rank(axis=1)#按行進行排名
method與ascending參數的使用與Series的相同
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。
推薦閱讀:
- Pandas數值排序 sort_values()的使用
- Python數據處理之pd.Series()函數的基本使用
- python數據處理67個pandas函數總結看完就用
- python數學建模之三大模型與十大常用算法詳情
- Python機器學習三大件之二pandas