Python數據分析處理(三)–運動員信息的分組與聚合

3.1 數據的爬取

代碼:

import pandas as pd
f = open('運動員信息表.csv')
data=pd.read_csv(f,skiprows=0,header=0)
print(data)

運行結果:

image-20211227174113867

首先使用pd.read_csv(f,skiprows=0,header=0)進行數據的讀取,並且將數據轉換成為dataframe的格式給對象,做初始化,方便後面進行數據的分析。

3.2統計男籃、女籃運動員的平均年齡、身高、體重

代碼:

sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])

print(sex.mean())

運行結果:

image-20211227174135861

首先我們先把數據提取出來做個分組,先把”年齡(歲)”,“身高(cm)”,”體重(kg)”這三行數據提取出來再根據性別進行分組。

sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])


然後再調用mean()求平均值,求出男籃、女籃運動員的平均年齡、身高、體重。

3.3統計男籃運動員年齡、身高、體重的極差值

代碼:

sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])
basketball_male=dict([x for x in sex])['男']
basketball_male
#求極差
def range_data_group(arr):
    return arr.max()-arr.min()
#進行每列不同的聚合
basketball_male.agg({
"年齡(歲)":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group
})

運行結果:

image-20211227174158091

image-20211227174229432

首先提取數據:

單行循環提取數據,dict([x for x in sex])在循環體內的語句隻有一行的情況的下,可以簡化for循環的書寫。定義一個函數def range_data_group(arr):求極差;

極差的求法:使用最大值減去最小值。就得到極差。

agg()函數:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*

func : 函數,函數名稱,函數列表,字典{‘行名/列名’,‘函數名’}

使用指定軸上的一個或多個操作進行聚合。

需要註意聚合函數操作始終是在軸(默認是列軸,也可設置行軸)上執行,不同於 numpy聚合函數

最後我們可以得到三列數據:分別對應”年齡(歲)”,“身高(cm)”,“體重(kg)”。

3.4 統計男籃運動員的體質指數

3.4.1添加體重指數

代碼:

data["體質指數"]=0
data

運行結果:

image-20211227174245588

添加一行體重指數:data[“體質指數”]=0

3.4.2計算bmi值並添加數據

代碼:

# 計算bmi數值
def outer(num):
    def bminum(sumbim):
        weight=data["身高(cm)"]
        height=data["體重(kg)"]
        sumbim=weight/(height/100)**2
        return num+sumbim
    return bminum

將該行數據添加上去:

代碼:

# 調用函數
bimdata=data["體質指數"]
data["體質指數"]=data[["體質指數"]].apply(outer(bimdata))
data

運行結果:

image-20211227174555765

編寫函數計算bmi數值 outer(num);然後再使用apply的方法將自定義的函數應用到”體質指數”這一列。然後計算出該列的值之後進行賦值。

data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))
97622)]

編寫函數計算bmi數值 outer(num) ;然後再使用apply的方法將自定義的函數應用到”體質指數”這一列。然後計算出該列的值之後進行賦值。

data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))

到此這篇關於Python數據分析處理 運動員信息的分組與聚合的文章就介紹到這瞭,更多相關Python數據分析處理 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: