Python高級數據分析之pandas和matplotlib繪圖
一、matplotlib 庫
一個用來繪圖的庫
import matplotlib.pyplot as plt
1)plt.imread(“圖片路徑”)
功能: 將圖片加載後返回一個維數組
>>> jin = plt.imread("./jin.png") >>> jin array([[[0.24313726, 0.24313726, 0.24705882], ..., [0.7294118 , 0.7294118 , 0.7294118 ]]], dtype=float32) >>> jin.shpae (273, 411, 3) ''' 這是一個三維數組 第一層代表將圖片分成273行, 第二層代表將圖片的第一層的每一行分為411列, 第三層代表將每一像素點中的(R,G,B) 註意:有些圖片加載後最內層有4個元素,分別是(R,G,B,A[阿爾法/透明度]) '''
2)plt.imshow(ndarray)顯示圖片
功能: 將多維數組渲染為一張圖片
>>> plt.imshow(nd) #將加載後的多維數組傳入就可以將圖片渲染出來 ''' 有的圖片加載出來之後數據范圍在0-255之間的需要將數據/255之後轉化為0-1之間的就可以和0-1的圖片進行合並操作 '''
這裡就可以將圖片進行處理(反轉,拉伸,改色)等操作
3)plt.imsave(ndarray)保存圖片
plt.imsave(ndarray)
默認保存到當前路徑
plt.imsave('圖片名稱.png',圖片數據,cmap='gray') #保存圖片 cmap:將圖片保存為黑白圖片
二、Pandas繪圖
1.繪制簡單的線型圖
1.1)簡單的Series圖表示例 .plot()
繪制正弦曲線
# 正弦曲線 x = np.linspace(0,2*np.pi,100) # 從0 到 2π 取100份 y = np.sin(x) # y 為sin(x) 的值 s = Series(data=y,index=x) # 構建一個Series對象 s.plot() # 使用Series的plot()方法
1.2) 兩個Series繪制的曲線可以疊加
2)簡單的DataFrame圖表示例 .plot()
繪制餘弦曲線
x = np.linspace(0,2*np.pi,100) # 從0 到 2π 取100份 df = DataFrame(data={'sin':np.sin(x),'cos':np.cos(x)},index=x) #創建DataFrame對象 df.plot()
2.數據驅動的線型圖(分析蘋果股票)
導包
import numpy as np import pandas as pd from pandas import Series,DataFrame
1.讀取數據
讀取文件AAPL.csv
df = pd.read_csv('./data/AAPL.csv') df.head()
2.檢查數據類型
df.dtypes
Date object #時間的數據類型為對象,在使用中需要做處理
Open float64
High float64
Low float64
Close float64
Adj Close float64
Volume float64
dtype: object
3.將’Date’這行數據轉換為時間數據類型
pd.to_datetime(Series對象)
功能: 將Series轉換為時間數據類型
df['Date'] # 這一列獲取出來是一個Series type(df['Date']) df['Date'] = pd.to_datetime(df['Date'])
df.dtypes
Date datetime64[ns] #此時已經是時間類型的數據瞭
Open float64
High float64
Low float64
Close float64
Adj Close float64
Volume float64
dtype: object
4.將’Date’設置為行索引
df.set_index('Date',inplace=True) ''' inplace:改變原來的變量的值 '''
5.繪制圖形,以字段Adj Close(已調整收盤價格)為數據繪制
df['Adj Close'].plot()
3.繪制簡單的柱狀圖
1) Series柱狀圖示例,kind = ‘bar’/’barh’
隨機產生5個數,對其繪制縱向柱狀圖
''' data: 生成之後為Y軸的數據 index: 生成之後為X軸的索引 ''' s = Series(data=np.random.randint(0,10,size=5),index=list('abcde')) #隨機產生5個數 s.plot(kind='bar')
隨機產生5個數,對其繪制橫向柱狀圖
''' data: 生成之後為Y軸的數據 index: 生成之後為X軸的索引 ''' s = Series(data=np.random.randint(0,10,size=5),index=list('abcde')) s.plot(kind='barh')
2) DataFrame柱狀圖示例
隨機產生一個二維數組,並繪制縱向(kind=’bar’)柱狀圖
''' index: 生成數據X軸的索引 columns: 特征的名稱 ''' df = DataFrame(np.random.randint(0,10,size=(8,4)),index=list('abcdefgh'),columns=list('ABCD')) df.plot(kind='bar')
隨機產生一個二維數組,並繪制橫向(kind=’barh’)柱狀圖
4.繪制簡單的直方圖
直方圖
直方圖(Histogram)又稱質量分佈圖。是一種統計報告圖,由一系列高度不等的縱向條紋或線段表示數據分佈的情況。 一般用橫軸表示數據類型,縱軸表示分佈情況。
s = Series(np.random.normal(loc=0,scale=5,size=10000)) # normal 正態分佈 s.hist() #這裡模擬出一組以0為中心,標準差為5的正態分佈數據, 繪制出的直方圖如下
5.繪制簡單的核密度(“ked”)圖
核心密度估計:對分佈的圖進行估計核心
我們繼續使用剛剛直方圖的 Series的正態分佈數據
Series(np.random.normal(loc=0,scale=5,size=10000)) s.plot(kind='kde')
直方圖一般和核密度圖常常被畫在一起,既展示出頻率,又展示出瞭概率
有兩組數組,我們將這兩組數據連接成為一個。
分析這組新數據
ndarr1 = np.random.normal(loc=-10,scale=5,size=5000) #第一組數據 ndarr2 = np.random.normal(loc=15,scale=2,size=5000) 第二組數據 ndarr = np.concatenate([ndarr1,ndarr2]) #將兩組數據合為一組 s = Series(ndarr) #生成Series對象 s.plot(kind='kde') # 核心 密度 估計 用來展示某個位置出現內容的概率的估計值 s.hist(density=True) # density表示直方圖也以 密度概率的值來展示 hist用來展示某個位置出現內容的實際頻率 #展示效果如下
''' s.plot(kind='kde') 展示某個位置的估計值 s.hist(density=True) 表示某個位置出現內容的實際頻率 '''
6.繪制簡單的散點圖
散佈圖是觀察兩個一維數據數列之間的關系的有效方法
示例數據
df = DataFrame(np.random.randint(0,150,size=(20,3)),columns=['python','math','eng']) df #模擬一個DataFrame數據,列名為'python','math','eng' python math eng 0 141 41 55 1 37 76 96 2 61 28 135 。。。 17 124 103 83 18 86 47 44 19 35 85 85
將這組數據生成散點圖
df.plot(kind='scatter',x='python',y='eng') # kind = 'scatter' , 給明標簽columns
這樣其實是沒有什麼實際的意義的
現在我們再加一列和“python”相關的數據
np.random.randint(-10,10,1)[0] # 0-10之間 隨機取一個數 df['php'] = df['python'].map(lambda x: x*0.9+np.random.randint(-10,10,1)[0]) df python math eng php 0 121 67 15 113.9 1 148 33 149 123.2 。。。 18 79 77 108 74.1 19 105 107 53 102.5
我們從數據是很難看出來python和php有什麼關系
這時我們就可以用散點圖來繪制出觀察
可以看出有python的值增大,php的值也會增大。
總結
到此這篇關於Python高級數據分析之pandas和matplotlib繪圖的文章就介紹到這瞭,更多相關Python pandas和matplotlib繪圖內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python Pandas工具繪制數據圖使用教程
- Pandas繪圖函數超詳細講解
- 一篇文章讓你快速掌握Pandas可視化圖表
- Python機器學習三大件之二pandas
- Python Pandas學習之Pandas數據結構詳解