pandas對齊運算的實現示例

1.算術運算和數據對齊

import numpy as np
import pandas as pd

1.1 Series

a1 = pd.Series(np.arange(4),index=['a','b','c','d'])
a2 = pd.Series(np.arange(5),index=['a','r','c','u','k'])
print(a1)
print("="*20)
print(a2)

a    0
b    1
c    2
d    3
dtype: int32
====================
a    0
r    1
c    2
u    3
k    4
dtype: int32

有相同的索引值相加後結果變為浮點數,不相同則返回NAN值。

a1 + a2  

a    0.0
b    NaN
c    4.0
d    NaN
k    NaN
r    NaN
u    NaN
dtype: float64

1.2 DataFrame

a3 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
a4 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','u','c'],columns=['m','e','r'])
print(a3)
print("="*20)
print(a4)

   q  w   e   r
a  0  1   2   3
b  4  5   6   7
c  8  9  10  11
====================
   m  e  r
a  0  1  2
u  3  4  5
c  6  7  8

隻有行和列索引都相同的才能運算,否則返回NAN值

a3 + a4  

 e   m     q   r     w
a 3.0   NaN NaN   5.0 NaN
b NaN   NaN NaN   NaN NaN
c 17.0  NaN NaN   19.0 NaN
u NaN   NaN NaN   NaN NaN

2.使用填充值的算術方法

2.1 Series

a1 = pd.Series(np.arange(4),index=['a','b','c','d'])
a2 = pd.Series(np.arange(5),index=['a','r','c','u','k'])
print(a1)
print("="*20)
print(a2)
print("="*20)
print(a1 + a2)    #有相同的索引值相加後結果變為浮點數,不相同索引值相加則返回NAN

a    0
b    1
c    2
d    3
dtype: int32
====================
a    0
r    1
c    2
u    3
k    4
dtype: int32
====================
a    0.0
b    NaN
c    4.0
d    NaN
k    NaN
r    NaN
u    NaN
dtype: float64

使用填充值,不會返回NAN值,如果a1,a2的索引值相同則將對應的值作算術運算,如果不同則作為一行新的數據,形成一個新的Series索引

a1.add(a2,fill_value=0)  #a1+a2 忽略NAN影響

a    0.0
b    1.0
c    4.0
d    3.0
k    4.0
r    1.0
u    3.0
dtype: float64

2.2 DataFrame

a3 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
a4 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','u','c'],columns=['m','e','r'])
print(a3)
print("="*20)
print(a4)
print("="*20)
print(a3 + a4)   #隻有行索引和列索引都相同的才能運算,否則返回NAN

   q  w   e   r
a  0  1   2   3
b  4  5   6   7
c  8  9  10  11
====================
   m  e  r
a  0  1  2
u  3  4  5
c  6  7  8
====================
    e     m     q     r     w
a   3.0   NaN   NaN   5.0   NaN
b   NaN   NaN   NaN   NaN   NaN
c  17.0   NaN   NaN   19.0  NaN
u   NaN   NaN   NaN   NaN   NaN

隻有當兩個DataFrame索引獨有的行和列獨有的索引對應的值才返回NAN,例如下面的 b行m列返回NAN值,其索引值是由a3獨有的b和a4獨有的m組成的,行和列其中之一的索引值不是獨有的,則返回對應DataFrame中的值,例如a行q列中的是a3,a4都有的,返回a3中 a行q列對應的值。

#使用填充值,
a3.add(a4,fill_value=0)  

    e    m  q     r    w
a 3.0    0.0  0.0 5.0    1.0
b 6.0    NaN  4.0 7.0    5.0
c 17.0   6.0  8.0 19.0   9.0
u 4.0    3.0  NaN 5.0    NaN

r 開頭字母表示會翻轉參數

1/a3

q w e r
a inf 1.000000 0.500000 0.333333
b 0.250 0.200000 0.166667 0.142857
c 0.125 0.111111 0.100000 0.090909

a3.rdiv(1)   #翻轉div(除法),結果等同 1/a3

q w e r
a inf 1.000000 0.500000 0.333333
b 0.250 0.200000 0.166667 0.142857
c 0.125 0.111111 0.100000 0.090909

reindex指定索引和缺失值

將a3的列索引替換為a4的列索引 ,如果索引名字不相同,則返回NAN(不改變原DataFrame索引)

a3.reindex(columns=a4.columns))

 m e r
a NaN 2 3
b NaN 6 7
c NaN 10 11

#對NAN進行填充
a3.reindex(columns=a4.columns,fill_value=66)  #把所有的NAN替換為66(可指定任意值)

 m e r
a 66 2 3
b 66 6 7
c 66 10 11

3.DataFrame和Series混合運算

3.1 按行廣播

arr = np.arange(12).reshape(3,4)
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

取出第一行

arr[0] #取出第一行

array([0, 1, 2, 3])

每一行都減去第一行(按行進行廣播)

arr - arr[0] #每一行都減去第一行(按行進行廣播)

array([[0, 0, 0, 0],
       [4, 4, 4, 4],
       [8, 8, 8, 8]])

a3 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
a3

    q w e r
a 0 1 2 3
b 4 5 6 7
c 8 9 10 11

位置索引 iloc[m,n] 第一個參數m表示行,第二個參數n表示列

s1 = a3.iloc[0]   #取出第一行
s1

q    0
w    1
e    2
r    3
Name: a, dtype: int32

每一行都減去第一行(按行進行廣播)

a3-s1    #每一行都減去第一行(按行進行廣播)

    q w e r
a 0 0 0 0
b 4 4 4 4
c 8 8 8 8

3.2 按列廣播

取出q這一列

s2 = a3['q']  #取出q這一列
s2

a    0
b    4
c    8
Name: q, dtype: int32

默認是行axis=1,指定axis=’index’或axis=0,按列進行廣播(a3所有列分別減去第q列)

a3.sub(s2,axis='index')  #默認是行axis=1,指定axis='index'(或axis=0),按列進行廣播(a3所有列分別減去第q列)

 q w e r
a 0 1 2 3
b 0 1 2 3
c 0 1 2 3

a3.sub(s2,axis=0)  #默認是行axis=1,指定axis=0(或)axis='index',按列進行廣播(a3所有列分別減去第q列)

    q w e r
a 0 1 2 3
b 0 1 2 3
c 0 1 2 3

a3.sub(s2)  #默認情況 axis=1

    a b c e q r w
a NaN NaN NaN NaN NaN NaN NaN
b NaN NaN NaN NaN NaN NaN NaN
c NaN NaN NaN NaN NaN NaN NaN

到此這篇關於pandas對齊運算的實現示例的文章就介紹到這瞭,更多相關pandas對齊運算內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: