pandas中關於apply+lambda的應用
apply(func [, args [, kwargs ]]) 函數用於當函數參數已經存在於一個元組或字典中時,間接地調用函數。args是一個包含將要提供給函數的按位置傳遞的參數的元組。如果省略瞭args,任 何參數都不會被傳遞,kwargs是一個包含關鍵字參數的字典。簡單說apply()的返回值就是func()的返回值,apply()的元素參數是有序的,元素的順序必須和func()形式參數的順序一致,與map的區別是前者針對column,後者針對元素
lambda是匿名函數,即不再使用def的形式,可以簡化腳本,使結構不冗餘何簡潔
a = lambda x : x + 1 a(10) 11
兩者結合可以做很多很多事情,比如split在series裡很多功能不可用,而index就可以做
比如有一串數據如下,要切分為總數,正確數,正確率,則可這樣做
96%(1368608/1412722)
97%(1389916/1427922)
97%(1338695/1373803)
96%(1691941/1745196)
95%(1878802/1971608)
97%(944218/968845)
96%(1294939/1336576)
import pandas as pd #先生成一個dataframe d = {"col1" : ["96%(1368608/1412722)", "97%(1389916/1427922)", "97%(1338695/1373803)", "96%(1691941/1745196)", "95%(1878802/1971608)", "97%(944218/968845)", "96%(1294939/1336576)"]} df1 = pd.DataFrame(d) #切分原文中識別率總數,采用apply + 匿名函數 #lambda 函數的意思是選取x的序列值 ,比如 x[6:9] #index函數的意思是把當前字符位置轉變為所在位置的位數 #-1是最後一位 df1['正確數'] = df1.iloc[:,0].apply(lambda x : x[x.index('(') + 1 : x.index('/')]) df1['總數'] = df1.iloc[:,0].apply(lambda x : x[x.index('/') + 1 : -1]) df1['正確率'] = df1.iloc[:,0].apply(lambda x : x[:x.index('(')]) df1
示例2
由一組dataframe數據,包括有數值型的三列氣象要素,由這三列通過公式計算人體舒適指數
應用到的人體舒適指數計算公式:
import pandas as pd import numpy as np import math path='D:\\data\\57582.csv' #文件路徑 data=pd.read_csv(path,index_col=0,encoding='gbk') #讀取數據有中文時用gbk解碼 #定義舒適指數公式函數,結果保留1位小數 def get_CHB(T,RH,S): return round(1.8*T-0.55*(1.8*T-26)*(1-RH/100)-3.2*math.sqrt(S)+32,1) #增加一列CHB並計算數據後賦值 data['舒適指數']=data.apply(lambda x:get_CHB(x['平均氣溫'],x['平均相對濕度'],x['2M風速']),axis=1) #打印結果 print(data) #保存結果 data.to_csv('D:\\CHB.csv',encoding='gbk')
代碼中使用瞭apply和lambda的組合,傳入的參數x為整個data數據,在函數中引入的參數則是x[‘平均氣溫’],x[‘平均相對濕度’],x[‘2M風速’],與自定義的函數get_CHB對應。最後需使用axis=1來指定是對列進行運算。
結果如圖所示:
到此這篇關於pandas中關於apply+lambda的應用的文章就介紹到這瞭,更多相關pandas apply+lambda內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python中pandas操作apply返回多列的實現
- 利用Pandas索引和選取數據方法詳解
- python數據處理67個pandas函數總結看完就用
- python數學建模之三大模型與十大常用算法詳情
- 解析pandas apply() 函數用法(推薦)