pandas map(),apply(),applymap()區別解析

基礎

以下操作基於python 3.6 windows 10 環境下 通過
將通過實例來演示三者的區別

toward_dict = {1: '東', 2: '南', 3: '西', 4: '北'}
df = pd.DataFrame({'house' : list('AABCEFG'),
          'price' : [100, 90, '', 50, 120, 150, 200],
          'toward' : ['1','1','2','3','','3','2']})
df

以下操作基於此圖中的df

map()方法

通過df.(tab)鍵,發現df的屬性列表中有apply() 和 applymap(),但沒有map().
map()是python 自帶的方法, 可以對df某列內的元素進行操作, 我個人最常用的場景就是有toward_dict的映射關系 ,為df中的toward匹配出結果,

 df['朝向'] = df.toward.map(toward_dict);df

代碼運行結果

結果就是沒有匹配出來, why???
因為df.toward這列數字是str型的, toward_dict中的key是int型,下面修正操作下:兩個思路:

第一種思路:`toward_dict`的key轉換為str型
toward_dict2 = dict((str(key), val) for key, val in toward_dict.items())

完美解決

# 第二種思路, 將df.toward轉為int型
df.toward = df.toward.map(lambda x: np.nan if x == '' else x).map(int,na_action='ignore')
df['朝向2'] = df.toward.map(toward_dict);df

結果呈現

apply() 方法

更新時間: 2018-08-10
我目前的實際工作中使用apply()方法比較少, 所以整理的內容比較簡陋, 後續涉及到數據分析方面可能會應用比較多些.

先將上面的測試中的map替換為apply,看看怎麼樣?
結果報錯瞭, ValueError, 還是老老實實寫實際操作例子吧 ?
參考DataFrame.apply官方文檔
文檔中第一個參數:

func : function
Function to apply to each column or row.

意思即是, 將傳入的func應用到每一列或每一行,進行元素級別的運算
第二個參數:

axis : {0 or ‘index’, 1 or ‘columns’}, default 0
Axis along which the function is applied:
0 or ‘index’: apply function to each column. # 註意這裡的解釋
1 or ‘columns’: apply function to each row.

舉例:

這裡寫圖片描述

這個要特別註意的,
沒有繼續使用map裡的DF, 是因為df.house是字符串, 不能進行np.sum運算,會報錯.
2018年12月3日 新增:
最近在工作中使用到瞭pandas.apply()方法,更新如下:

背景介紹:

一個 df 有三個列需要進行計算,change_type 值 為1和0, 1為漲價,0為降價, price為現價, changed為漲降價的絕對值, 現求:漲降價的比例, 精確到0位,無小數位,
解決思路:
1.最主要的計算是: 漲降價的絕對值/ 原價
2.最主要的難點是: 漲價的原價 = 現價 – 絕對值
降價的原價 = 現價 + 絕對值
偽代碼如下: 漲降價比例 = round(changed/(price 加上或減去 changed), 0)
就是我需求的結果瞭.

解決方案 如下:
以下代碼經過win 10 環境 python3.6 版本測試通過

import pandas as pd
df = pd.DataFrame({'change_type' : [1,1,0,0,1,0],
          'price' : [100, 90, 50, 120, 150, 200],
          'changed' : [10,8,4,11,14,10]})

def get_round(change_type, price, changed_val):
	"""
	策略設計
	"""
	if change_type == 0:
		return round(changed_val/(price + changed_val) * 100, 2)
	elif change_type == 1:
		return round(changed_val/(price - changed_val) * 100, 2)
	else:
		print(f'{change} is not exists')

# 策略實現
df['round'] = df.apply(lambda x: get_round(x['change_type'], x['price'], x['changed']),axis=1)

若有問題, 歡迎指正, 謝謝

applymap()

參考DataFrame.applymap官方文檔:

func : callable
Python function, returns a single value from a single value.

文檔很簡單, 隻有一個參數, 即傳入的func方法
樣例參考文檔吧, 沒有比這個更簡單瞭

總結:

map() 方法是pandas.series.map()方法, 對DF中的元素級別的操作, 可以對df的某列或某多列, 可以參考文檔
apply(func) 是DF的屬性, 對DF中的行數據或列數據應用func操作.
applymap(func) 也是DF的屬性, 對整個DF所有元素應用func操作

到此這篇關於pandas map(),apply(),applymap()區別解析的文章就介紹到這瞭,更多相關pandas map(),apply(),applymap()內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: