pandas map(),apply(),applymap()區別解析
基礎
以下操作基於python 3.6 windows 10 環境下 通過
將通過實例來演示三者的區別
toward_dict = {1: '東', 2: '南', 3: '西', 4: '北'} df = pd.DataFrame({'house' : list('AABCEFG'), 'price' : [100, 90, '', 50, 120, 150, 200], 'toward' : ['1','1','2','3','','3','2']}) df
map()方法
通過df.(tab)鍵,發現df的屬性列表中有apply() 和 applymap(),但沒有map().
map()是python 自帶的方法, 可以對df某列內的元素進行操作, 我個人最常用的場景就是有toward_dict
的映射關系 ,為df中的toward
匹配出結果,
df['朝向'] = df.toward.map(toward_dict);df
結果就是沒有匹配出來, why???
因為df.toward
這列數字是str型的, toward_dict
中的key是int型,下面修正操作下:兩個思路:
第一種思路:`toward_dict`的key轉換為str型 toward_dict2 = dict((str(key), val) for key, val in toward_dict.items())
# 第二種思路, 將df.toward轉為int型 df.toward = df.toward.map(lambda x: np.nan if x == '' else x).map(int,na_action='ignore') df['朝向2'] = df.toward.map(toward_dict);df
apply() 方法
更新時間: 2018-08-10
我目前的實際工作中使用apply()
方法比較少, 所以整理的內容比較簡陋, 後續涉及到數據分析方面可能會應用比較多些.
先將上面的測試中的map
替換為apply
,看看怎麼樣?
結果報錯瞭, ValueError
, 還是老老實實寫實際操作例子吧 ?
參考DataFrame.apply官方文檔
文檔中第一個參數:
func : function
Function to apply to each column or row.
意思即是, 將傳入的func
應用到每一列或每一行,進行元素級別的運算
第二個參數:
axis : {0 or ‘index’, 1 or ‘columns’}, default 0
Axis along which the function is applied:
0 or ‘index’: apply function to each column. # 註意這裡的解釋
1 or ‘columns’: apply function to each row.
舉例:
這個要特別註意的,
沒有繼續使用map裡的DF, 是因為df.house是字符串, 不能進行np.sum
運算,會報錯.
2018年12月3日
新增:
最近在工作中使用到瞭pandas.apply()
方法,更新如下:
背景介紹:
一個 df
有三個列需要進行計算,change_type
值 為1和0, 1為漲價,0為降價, price
為現價, changed
為漲降價的絕對值, 現求:漲降價的比例, 精確到0位,無小數位,
解決思路:
1.最主要的計算是: 漲降價的絕對值/ 原價
2.最主要的難點是: 漲價的原價 = 現價 – 絕對值
降價的原價 = 現價 + 絕對值
偽代碼如下: 漲降價比例 = round(changed/(price 加上或減去 changed), 0)
就是我需求的結果瞭.
解決方案 如下:
以下代碼經過win 10 環境 python3.6 版本測試通過
import pandas as pd df = pd.DataFrame({'change_type' : [1,1,0,0,1,0], 'price' : [100, 90, 50, 120, 150, 200], 'changed' : [10,8,4,11,14,10]}) def get_round(change_type, price, changed_val): """ 策略設計 """ if change_type == 0: return round(changed_val/(price + changed_val) * 100, 2) elif change_type == 1: return round(changed_val/(price - changed_val) * 100, 2) else: print(f'{change} is not exists') # 策略實現 df['round'] = df.apply(lambda x: get_round(x['change_type'], x['price'], x['changed']),axis=1)
若有問題, 歡迎指正, 謝謝
applymap()
參考DataFrame.applymap官方文檔:
func : callable
Python function, returns a single value from a single value.
文檔很簡單, 隻有一個參數, 即傳入的func
方法
樣例參考文檔吧, 沒有比這個更簡單瞭
總結:
map() 方法是pandas.series.map()方法, 對DF中的元素級別的操作, 可以對df的某列或某多列, 可以參考文檔
apply(func) 是DF的屬性, 對DF中的行數據或列數據應用func
操作.
applymap(func) 也是DF的屬性, 對整個DF所有元素應用func
操作
到此這篇關於pandas map(),apply(),applymap()區別解析的文章就介紹到這瞭,更多相關pandas map(),apply(),applymap()內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 詳解Pandas的三大利器(map,apply,applymap)
- Python數據分析之 Pandas Dataframe應用自定義
- python數據分析apply(),map(),applymap()用法
- python中pandas操作apply返回多列的實現
- python 利用panda 實現列聯表(交叉表)