python-pandas創建Series數據類型的操作

1.什麼是pandas

2.查看pandas版本信息

print(pd.__version__)

輸出:

0.24.1

3.常見數據類型

常見的數據類型:

– 一維: Series

– 二維: DataFrame

– 三維: Panel …

– 四維: Panel4D …

– N維: PanelND …

4.pandas創建Series數據類型對象

1). 通過列表創建Series對象

array = ["粉條", "粉絲", "粉帶"]
# 如果不指定索引, 默認從0開始;
s1 = pd.Series(data=array)
print(s1)
# 如果不指定索引, 默認從0開始;
ss1 = pd.Series(data=array, index=['A', 'B', 'C'])
print(ss1)

輸出:

0    粉條
1    粉絲
2    粉帶
dtype: object
A    粉條
B    粉絲
C    粉帶
dtype: object

2). 通過numpy的對象Ndarray創建Series;

n = np.random.randn(5)   # 隨機創建一個ndarray對象;
s2 = pd.Series(data=n)
print(s2)
# 修改元素的數據類型;
ss2 = s2.astype(np.int)
print(ss2)

輸出:

0   -1.649755
1    0.607479
2    0.943136
3   -1.794060
4    1.569035
dtype: float64
0   -1
1    0
2    0
3   -1
4    1
dtype: int64

3). 通過字典創建Series對象;

dict = {string.ascii_lowercase[i]:i for i in range(10)}
s3 = pd.Series(dict)
print(s3)

輸出:

a    0
b    1
c    2
d    3
e    4
f    5
g    6
h    7
i    8
j    9
dtype: int64

5.Series基本操作

共同部分:

import pandas as pd
import numpy as np
import  string

array = ["粉條", "粉絲", "粉帶"]
s1 = pd.Series(data=array)
print(s1)

輸出:

0    粉條
1    粉絲
2    粉帶
dtype: object

1). 修改Series索引.index

print(s1.index) #輸出:RangeIndex(start=0, stop=3, step=1)
s1.index = ['A', 'B', 'C']
print(s1) 

輸出:

A    粉條
B    粉絲
C    粉帶
dtype: object

2). Series縱向拼接.append

s1.index = ['A', 'B', 'C']
array = ["粉條", "粉絲", "粉帶"]
# 如果不指定索引, 默認從0開始;
s2 = pd.Series(data=array)
s3 = s1.append(s2)
print(s3)

輸出:

A    粉條
B    粉絲
C    粉帶
0    粉條
1    粉絲
2    粉帶
dtype: object

3). 刪除指定索引對應的元素.drop(‘index’)

s3 = s3.drop('C')  # 刪除索引為‘C'對應的值;
print(s3)

輸出:

A    粉條
B    粉絲
0    粉條
1    粉絲
2    粉帶
dtype: object

4). 根據指定的索引查找元素

print(s3['B'])   #粉絲
s3['B'] = np.nan #索引B處的值替換為缺失值
print(s3)

輸出:

A     粉條
B    NaN
0     粉條
1     粉絲
2     粉帶
dtype: object

5). 切片操作 — 同列表

print(s3[:2])  #顯示前兩個元素
print(s3[::-1]) #逆序
print(s3[-2:])  # 顯示最後兩個元素

輸出:

A     粉條
B    NaN
dtype: object
-------------------------
2     粉帶
1     粉絲
0     粉條
B    NaN
A     粉條
dtype: object
-------------------------
1    粉絲
2    粉帶
dtype: object

6.Series運算

先設置兩個Series對象:

import pandas as pd
import numpy as np
import  string


s1  = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
s2  = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))

print(s1)
print(s2)

按照對應的索引進行計算, 如果索引不同,則填充為Nan;

1).加法add

print(s1 + s2)
print(s1.add(s2))

輸出:

a    NaN
b    NaN
c    4.0
d    6.0
e    8.0
f    NaN
g    NaN
h    NaN
dtype: float64

2).減法sub

print(s1 - s2)
print(s1.sub(s2))

輸出:

a    NaN
b    NaN
c    0.0
d    0.0
e    0.0
f    NaN
g    NaN
h    NaN
dtype: float64

3).乘法mul

print(s1 * s2)
print(s1.mul(s2))

輸出:

a     NaN
b     NaN
c     4.0
d     9.0
e    16.0
f     NaN
g     NaN
h     NaN
dtype: float64

4).除法div

print(s1 / s2)
print(s1.div(s2))

輸出:

a    NaN
b    NaN
c    1.0
d    1.0
e    1.0
f    NaN
g    NaN
h    NaN
dtype: float64

5).求中位數median

print(s1.median())

輸出:

2.0

6).求和sum

print(s1.sum())

輸出:

10

7).最大值max

print(s1.max())

輸出:

4

8).最小值min

print(s1.min())

輸出:

0

7.特殊的where方法

series中的where方法運行結果和numpy中完全不同

import pandas as pd
import numpy as np
import string
s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
print(s1)

輸出:

a    0
b    1
c    2
d    3
e    4
dtype: int64
print(s1.where(s1 > 3))

大於3的顯示,不大於3的為NaN

# 對象中小於3的元素賦值為10;
print(s1.where(s1 > 3, 10))

# 對象中大於3的元素賦值為10;
print(s1.mask(s1 > 3, 10))

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: