python-pandas創建Series數據類型的操作
1.什麼是pandas
2.查看pandas版本信息
print(pd.__version__)
輸出:
0.24.1
3.常見數據類型
常見的數據類型:
– 一維: Series
– 二維: DataFrame
– 三維: Panel …
– 四維: Panel4D …
– N維: PanelND …
4.pandas創建Series數據類型對象
1). 通過列表創建Series對象
array = ["粉條", "粉絲", "粉帶"] # 如果不指定索引, 默認從0開始; s1 = pd.Series(data=array) print(s1) # 如果不指定索引, 默認從0開始; ss1 = pd.Series(data=array, index=['A', 'B', 'C']) print(ss1)
輸出:
0 粉條 1 粉絲 2 粉帶 dtype: object A 粉條 B 粉絲 C 粉帶 dtype: object
2). 通過numpy的對象Ndarray創建Series;
n = np.random.randn(5) # 隨機創建一個ndarray對象; s2 = pd.Series(data=n) print(s2) # 修改元素的數據類型; ss2 = s2.astype(np.int) print(ss2)
輸出:
0 -1.649755 1 0.607479 2 0.943136 3 -1.794060 4 1.569035 dtype: float64 0 -1 1 0 2 0 3 -1 4 1 dtype: int64
3). 通過字典創建Series對象;
dict = {string.ascii_lowercase[i]:i for i in range(10)} s3 = pd.Series(dict) print(s3)
輸出:
a 0 b 1 c 2 d 3 e 4 f 5 g 6 h 7 i 8 j 9 dtype: int64
5.Series基本操作
共同部分:
import pandas as pd import numpy as np import string array = ["粉條", "粉絲", "粉帶"] s1 = pd.Series(data=array) print(s1)
輸出:
0 粉條 1 粉絲 2 粉帶 dtype: object
1). 修改Series索引.index
print(s1.index) #輸出:RangeIndex(start=0, stop=3, step=1) s1.index = ['A', 'B', 'C'] print(s1)
輸出:
A 粉條 B 粉絲 C 粉帶 dtype: object
2). Series縱向拼接.append
s1.index = ['A', 'B', 'C'] array = ["粉條", "粉絲", "粉帶"] # 如果不指定索引, 默認從0開始; s2 = pd.Series(data=array) s3 = s1.append(s2) print(s3)
輸出:
A 粉條 B 粉絲 C 粉帶 0 粉條 1 粉絲 2 粉帶 dtype: object
3). 刪除指定索引對應的元素.drop(‘index’)
s3 = s3.drop('C') # 刪除索引為‘C'對應的值; print(s3)
輸出:
A 粉條 B 粉絲 0 粉條 1 粉絲 2 粉帶 dtype: object
4). 根據指定的索引查找元素
print(s3['B']) #粉絲 s3['B'] = np.nan #索引B處的值替換為缺失值 print(s3)
輸出:
A 粉條 B NaN 0 粉條 1 粉絲 2 粉帶 dtype: object
5). 切片操作 — 同列表
print(s3[:2]) #顯示前兩個元素 print(s3[::-1]) #逆序 print(s3[-2:]) # 顯示最後兩個元素
輸出:
A 粉條 B NaN dtype: object ------------------------- 2 粉帶 1 粉絲 0 粉條 B NaN A 粉條 dtype: object ------------------------- 1 粉絲 2 粉帶 dtype: object
6.Series運算
先設置兩個Series對象:
import pandas as pd import numpy as np import string s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5])) s2 = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8])) print(s1) print(s2)
按照對應的索引進行計算, 如果索引不同,則填充為Nan;
1).加法add
print(s1 + s2) print(s1.add(s2))
輸出:
a NaN b NaN c 4.0 d 6.0 e 8.0 f NaN g NaN h NaN dtype: float64
2).減法sub
print(s1 - s2) print(s1.sub(s2))
輸出:
a NaN b NaN c 0.0 d 0.0 e 0.0 f NaN g NaN h NaN dtype: float64
3).乘法mul
print(s1 * s2) print(s1.mul(s2))
輸出:
a NaN b NaN c 4.0 d 9.0 e 16.0 f NaN g NaN h NaN dtype: float64
4).除法div
print(s1 / s2) print(s1.div(s2))
輸出:
a NaN b NaN c 1.0 d 1.0 e 1.0 f NaN g NaN h NaN dtype: float64
5).求中位數median
print(s1.median())
輸出:
2.0
6).求和sum
print(s1.sum())
輸出:
10
7).最大值max
print(s1.max())
輸出:
4
8).最小值min
print(s1.min())
輸出:
0
7.特殊的where方法
series中的where方法運行結果和numpy中完全不同
import pandas as pd import numpy as np import string s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5])) print(s1)
輸出:
a 0 b 1 c 2 d 3 e 4 dtype: int64
print(s1.where(s1 > 3))
大於3的顯示,不大於3的為NaN
# 對象中小於3的元素賦值為10; print(s1.where(s1 > 3, 10))
# 對象中大於3的元素賦值為10; print(s1.mask(s1 > 3, 10))
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- pandas的Series類型與基本操作詳解
- pandas數據類型之Series的具體使用
- Python數據分析 Pandas Series對象操作
- Pandas中Series的創建及數據類型轉換
- Python Pandas學習之Pandas數據結構詳解