pandas組內排序,並在每個分組內按序打上序號的操作

Posted on 2021-03-26 by WalkonNet

問題：

pandas組內排序，並在每個分組內按序打上序號

描述：

pandas dataframe 對dep_id組內的salary排序。希望給下面原本隻有前三列的dataframe，添加上第四列。

等價於sql裡的排序函數 row_number() over() 功能

假設我已經建好瞭僅有前三列的dataframe，數據集命名為 MyData，

解決方案如下：

MyData['sort_id'] = MyData['salary'].groupby(MyData['dep_id']).rank()

結果如下：

補充：Pandas.DataFrame實現分組、排序並且為分組插入排名

1. 示例數據（各班級學生得分）

import pandas as pd
data_dict = {"name": 
       ["Rose", "Jack", "Tom", "Kyle", "Jery", "Adam", "Bill", "David", "Denny", "Evan"],
      "class": [1, 2, 3, 1, 2, 3, 1, 2, 3, 1],
      "score": [88, 92, 38, 98, 22, 65, 45, 53, 97, 100]}
df = pd.DataFrame(data=data_dict)
df

2. 按班級分組

df = df.groupby('class', sort=False)\
    .apply(lambda x:x.sort_values("score", ascending=False))\
    .reset_index(drop=True)
df

3. 給各分組班級增加排名列

df["rank"] = None
# 標識班級
flag = df.loc[0].values[1]
rank = 0
for i in range(len(df)):
  temp = df.loc[i].values[1]
  if (temp == flag).all():
    # 同一班級
    rank += 1
  else:
    # 不同班級，重新計算排名
    flag = temp
    rank = 1
  df.loc[i, "rank"] = rank
df

以上為個人經驗，希望能給大傢一個參考，也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方，望不吝賜教。

pandas組內排序,並在每個分組內按序打上序號的操作

問題：

描述：

解決方案如下：

1. 示例數據（各班級學生得分）

2. 按班級分組

3. 給各分組班級增加排名列

推薦閱讀：

發佈留言取消回覆

近期文章

問題：

描述：

解決方案如下：

1. 示例數據（各班級學生得分）

2. 按班級分組

3. 給各分組班級增加排名列

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆