pandas中關於apply+lambda的應用

apply(func [, args [, kwargs ]]) 函數用於當函數參數已經存在於一個元組或字典中時,間接地調用函數。args是一個包含將要提供給函數的按位置傳遞的參數的元組。如果省略瞭args,任 何參數都不會被傳遞,kwargs是一個包含關鍵字參數的字典。簡單說apply()的返回值就是func()的返回值,apply()的元素參數是有序的,元素的順序必須和func()形式參數的順序一致,與map的區別是前者針對column,後者針對元素

lambda是匿名函數,即不再使用def的形式,可以簡化腳本,使結構不冗餘何簡潔

a =  lambda x  : x + 1 
a(10)
 
11

兩者結合可以做很多很多事情,比如split在series裡很多功能不可用,而index就可以做

比如有一串數據如下,要切分為總數,正確數,正確率,則可這樣做

96%(1368608/1412722)
97%(1389916/1427922)
97%(1338695/1373803)
96%(1691941/1745196)
95%(1878802/1971608)
97%(944218/968845)
96%(1294939/1336576)

import pandas as pd
#先生成一個dataframe
d = {"col1" : ["96%(1368608/1412722)",
"97%(1389916/1427922)",
"97%(1338695/1373803)",
"96%(1691941/1745196)",
"95%(1878802/1971608)",
"97%(944218/968845)",
"96%(1294939/1336576)"]}
df1 = pd.DataFrame(d)
 
#切分原文中識別率總數,采用apply + 匿名函數
#lambda 函數的意思是選取x的序列值 ,比如 x[6:9]
#index函數的意思是把當前字符位置轉變為所在位置的位數
#-1是最後一位
df1['正確數'] = df1.iloc[:,0].apply(lambda x : x[x.index('(') + 1 : x.index('/')])
df1['總數'] = df1.iloc[:,0].apply(lambda x : x[x.index('/') + 1 : -1])
df1['正確率'] = df1.iloc[:,0].apply(lambda x : x[:x.index('(')])
df1

示例2

由一組dataframe數據,包括有數值型的三列氣象要素,由這三列通過公式計算人體舒適指數

在這裡插入圖片描述

應用到的人體舒適指數計算公式:

在這裡插入圖片描述

import pandas as pd
import numpy as np
import math
path='D:\\data\\57582.csv'  #文件路徑
data=pd.read_csv(path,index_col=0,encoding='gbk')  #讀取數據有中文時用gbk解碼
#定義舒適指數公式函數,結果保留1位小數
def get_CHB(T,RH,S):
    return round(1.8*T-0.55*(1.8*T-26)*(1-RH/100)-3.2*math.sqrt(S)+32,1)
#增加一列CHB並計算數據後賦值
data['舒適指數']=data.apply(lambda x:get_CHB(x['平均氣溫'],x['平均相對濕度'],x['2M風速']),axis=1)
#打印結果
print(data)
#保存結果
data.to_csv('D:\\CHB.csv',encoding='gbk')

代碼中使用瞭apply和lambda的組合,傳入的參數x為整個data數據,在函數中引入的參數則是x[‘平均氣溫’],x[‘平均相對濕度’],x[‘2M風速’],與自定義的函數get_CHB對應。最後需使用axis=1來指定是對列進行運算。

結果如圖所示:

在這裡插入圖片描述

 到此這篇關於pandas中關於apply+lambda的應用的文章就介紹到這瞭,更多相關pandas apply+lambda內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: