python之 matplotlib和pandas繪圖教程

Posted on 2021-03-08 by WalkonNet

不得不說使用python庫matplotlib繪圖確實比較醜，但使用起來還算是比較方便，做自己的小小研究可以使用。這裡記錄一些統計作圖方法，包括pandas作圖和plt作圖。

前提是先導入第三方庫吧

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

然後以下這兩句用於正常顯示中文標簽什麼的。

plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來正常顯示中文標簽
plt.rcParams['axes.unicode_minus'] = False # 用來正常顯示負號

當然還有一些最基本的步驟:

plt.xticks(x,xtk,size=12,rotation=50) #設置字體大小和字體傾斜度
plt.xlabel(u'城市') # x軸標簽
plt.ylabel(u'數量')
plt.title(u'朋友所在城市') # 圖的名稱
plt.legend() # 正常顯示標題
plt.show() # 顯示圖像
plt.close() # 繪圖後養成習慣性的關掉

對於pandas中的二維數據框，可以直接作圖（Series類型），簡單的折線圖或者曲線圖如下：

sdata.plot(color='r', style='-o')
plt.show()

如果沒有用pandas，直接作曲線圖，可以這樣寫：

plot(x,y, color ='blue', linewidth=2.5, linestyle="--")

1，柱狀圖

rects1=plt.bar(           #(x,data) 就是所要畫的二維數據
    left=x,           #x 是X坐標軸數據，即每個塊的x軸起始位置
    height=data,         #data是Y坐標軸的數據，即每個塊的y軸高度
    width=[0.1,0.2,0.3],     #每一個塊的顯示寬度
    bottom=[1,2,3],       #每一個塊的底部高度
    color='y',          #塊的顏色
    edgecolor='g',        #塊的邊界顏色
    linewidth=2,         #塊的線條寬度
    xerr=1,           #x軸誤差bar
    yerr=1,           #y軸誤差bar
    ecolor='r',         #誤差bar的顏色
    capsize=1,          #誤差bar的線條寬度
    orientation='vertical',   #塊的方向 (horizontal,vertical)
    align="center",       #塊的位置 (center, left, right)
    hold=None
    )
 
plt.show()

2，餅圖

plot2=plt.pie(data,             # 每個餅塊的實際數據，如果大於1，會進行歸一化，計算percentage
    explode=[0.0,0.1,0.2],        # 每個餅塊離中心的距離
    colors=['y','r','g'],        # 每個餅塊的顏色
    labels=['women','men','unknown'],  # 每個餅塊的標簽
    labeldistance=1.2,          # 每個餅塊標簽到中心的距離
    autopct='%1.1f%%',         # 百分比的顯示格式
    pctdistance=0.4,           # 百分比到中心的距離
    shadow=True,             # 每個餅塊是否顯示陰影
    startangle=0,            # 默認從x軸正半軸逆時針起
    radius=1.0              # 餅塊的半徑
    )
plt.axis('equal') # 顯示為圓形，避免比例壓縮為橢圓
plt.show()

3，共享X軸，Y軸左右軸標（帕累托分析圖）

數據樣例如下，名稱為va，類型為Series，左邊為職位名稱，右邊為數量：

sales     4140
technical   2720
support    2229
IT       1227
product_mng   902
marketing    858
RandD      787
accounting   767
hr       739
management   630

作圖：

fr = pd.Series(va.values.cumsum() / va.values.sum())
va.plot(kind='bar')
fr.plot(color='r',secondary_y=True, style='-o')
plt.annotate(format(fr[7], '.2%'), xy=(7, fr[7]), xytext=(7*0.9, fr[7]*0.9),
       arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=.2')) # 用於註釋圖形指標
# plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來正常顯示中文標簽
# plt.rcParams['axes.unicode_minus'] = False # 用來正常顯示負號
# plt1 = plt.pie(va.values,
#        labels=va.index,
#        autopct='%1.1f%%')
plt.xticks(rotation=50) # 設置字體大小和字體傾斜度
plt.show()

左邊為出現的頻率，右邊為累積百分比（這裡數據以降序排列較好，便於直觀地觀察），效果如下：

在pandas中，曲線圖可以直接畫，比如data中有多個屬性，可以直接使用data.plot()。使用plt，若各個屬性需要共用XY軸，那麼可以重復plot即可。

4，箱型圖

使用pandas畫箱型圖簡單方便，但是註釋比較麻煩，可以用annotate添加異常點的註釋。若使用之前的數據va，則先創建二維數據框再畫圖。如果有多個列為數字類型，那麼可以畫每個列的箱型圖，這裡隻有一列數據，如下：

pd.DataFrame(va).boxplot()
plt.show()

使用plt直接進行作圖：

plt.boxplot(data,labels=[]，
     sym='o',whis=1.5)

其中，data可以是一維的，也可多維，若為多維則lables為每一維度的標簽。sym為異常值的形狀，whis為調節垂直線段的長度。效果如下：

5，多張圖在一張畫佈中，即多個子圖

使用plt:

plt.subplot(221)
plt.plot(x, y1,'r-', lw=2) 
plt.subplot(222)
plt.plot(x,y2)

使用pandas：

data.plot(subplots=True, color=['r','b'], style=['-o','-'])
plt.show()

排版方式有不同，pandas是垂直排列，plt可以自己指定位置。pandas效果如下：

補充：Python DataFrame 多條件篩選使用&

我就廢話不多說瞭，大傢還是直接看代碼吧~

DF6
Out[42]: 
 B C D
0 1 B 10.750
1 3 C 8.875
2 2 T 58.000
3 2 L 57.000
4 3 Y 46.000

DF6[(DF6.B>1) & (DF6.D > 10)]

Out[45]: 
 B C D
2 2 T 58.0
3 2 L 57.0
4 3 Y 46.0

以上為個人經驗，希望能給大傢一個參考，也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方，望不吝賜教。

python之 matplotlib和pandas繪圖教程

1，柱狀圖

2，餅圖

3，共享X軸，Y軸左右軸標（帕累托分析圖）

4，箱型圖

5，多張圖在一張畫佈中，即多個子圖

推薦閱讀：

發佈留言取消回覆

近期文章

1，柱狀圖

2，餅圖

3，共享X軸，Y軸左右軸標（帕累托分析圖）

4，箱型圖

5，多張圖在一張畫佈中，即多個子圖

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆