聊聊prod()與cumprod()區別cumsum()
pandas.Series.cumprod 官方文檔
cumprod()累積連乘
Series.cumprod(axis=None, skipna=True, *args, **kwargs) #實現功能:Return cumulative product over a DataFrame or Series axis. #實現功能:Returns a DataFrame or Series of the same size containing the cumulative product. #return:scalar or Series
cumsum()累積連加
pandas.Series.prod官方文檔
Series.prod(axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs) # 實現功能:Return the product of the values for the requested axis. # return:scalar or Series
優點沒看明白,因為常規情況下,所用的.prod()並非pandas下的函數,而是numpy下的函數。
numpy.prod官方文檔
numpy.prod(a, axis=None, dtype=None, out=None, keepdims=<class numpy._globals._NoValue>) # 實現功能:Return the product of array elements over a given axis. # return:product_along_axis : ndarray
返回給定軸上數組元素的乘積。
跟cumprod不同,cumprod是計算當前一個累積乘上前面所有的數據,更多是一個list;prod返回的是給定這個軸上最終一個值。
補充:【python初學者】簡單易懂的圖解:np.cumsum和np.cumprod函數到底在幹嘛?
1.np.cumsum
本人是一名python小白,最近過完瞭python的基本知識後,在看《利用python進行數據分析》這本書,書中cumsum函數一筆帶過留下本小白“懵逼樹下你和我”,當然是我自己的問題不是書的問題,經過畫圖理解後漸漸明白瞭這個函數到底在幹麼。
1.1np.cumsum-軸的概念
首先,在學習cumsum函數之前我們應該先明白什麼是軸,以下面代碼來進行說明:
arr=np.arange(1,17,1).reshape((2,2,4)) arr
array([[[ 1, 2, 3, 4], [ 5, 6, 7, 8]], [[ 9, 10, 11, 12], [13, 14, 15, 16]]])
其實數組的軸(axis)就是數組的維度,上面的代碼生成瞭一個224的數組,所以
1、這個數組的0軸為2 ,axis=0
2、這個數組的1軸為2 ,axis=1
3、這個數組的2軸為4 ,axis=2
該數組如圖所示(藍,橙,黃,綠都是2軸,橙和綠上的“2軸”畫圖時忘瞭標註):
這裡還要補充說一下:紅色的數字隻是因為我用的iPad畫圖很不方便所以沒改成黑色,忽略就好
1.2cumsum(axis=0)
cumsum作用:計算軸向元素累加和,返回由中間結果組成的數組
這句概念中我認為大傢理解起來比較難受的地方應該是軸向元素累加。
首先,通過前文對軸概念的理解我們可以知道
axis=0代表著最外層的維度也就是0軸(這裡可能說法不太正確,主要為瞭配合上節圖片),所以就是0軸的累加計算,我們以前文用到的數組為例(紅色虛線表示按照0軸進行累加):
step1:
沿著0軸進行累加
step2:
將[1,2,3,4]和[9,10,11,12]進行累加,將[5,6,7,8]和[13,14,15,16]
代碼:
arr=np.array([[[ 1, 2, 3, 4], [ 5, 6, 7, 8]], [[ 9, 10, 11, 12], [13, 14, 15, 16]]]) arr.cumsum(axis=0)
結果為:
array([[[ 1, 2, 3, 4], [ 5, 6, 7, 8]], [[10, 12, 14, 16], [18, 20, 22, 24]]])
1.3cumsum(axis=1)
這裡我們還是以之前舉例的數組為例,沿著1軸進行累加(也就是2 * 2 * 4中的第二個2),這裡為瞭方便講解我將數組的擺放位置換瞭一下,不影響哈~
step1:
紅色虛線代表我們現在應該沿著1軸進行累加啦!
step2:
既然沿著1軸進行累加,我們是不是就應該在1軸內部進行累加呢?
所以就應該[1,2,3,4]和[5,6,7,8]進行累加,[9,10,11,12]和[13,14,15,16]進行累加
代碼結果:
arr.cumsum(axis=1) #運行結果 array([[[ 1, 2, 3, 4], [ 6, 8, 10, 12]], [[ 9, 10, 11, 12], [22, 24, 26, 28]]])
1.4cumsum(axis=2)
都已經講到沿著軸2進行累加瞭,廢話就不多說瞭直接放圖,大傢看看有沒有做對吧
step1:
老規矩:紅色虛線表示沿著2軸進行累加,所以應該是1,2,3,4進行累加,5,6,7,8進行累加,依次類推
step2
我們以藍色這一項為例:
第一項:1第二項:1+2=3第三項:1+2+3=6第四項:1+2+3+4=10
代碼結果:
arr.cumsum(axis=2) #運行結果 array([[[ 1, 3, 6, 10], [ 5, 11, 18, 26]], [[ 9, 19, 30, 42], [13, 27, 42, 58]]])
講到這裡我相信大傢應該能自己摸索出cumprod函數在幹嘛啦!本篇文章裡面因為需要結合圖片進行講解所以有些句子並不恰當~希望本篇文章能夠讓你明白cumsum函數到底在幹嘛呀~
推薦閱讀:
- Pandas數據結構詳細說明及如何創建Series,DataFrame對象方法
- Python數據分析 Pandas Series對象操作
- Python Pandas學習之Pandas數據結構詳解
- Python Pandas創建Dataframe數據框的六種方法匯總
- Python機器學習三大件之二pandas