手把手教你用Matplotlib實現數據可視化

介紹

在使用機器學習方法解決問題的過程中,一定會遇到需要針對數據進行繪圖的場景。

Matplotlib 是支持 Python 語言的開源繪圖庫,因為其支持豐富的繪圖類型、簡單的繪圖方式以及完善的接口文檔,深受 Python 工程師、科研學者、數據工程師等各類人士的喜歡

Matplotlib 擁有著十分活躍的社區以及穩定的版本迭代,當我們在學習機器學習的課程時,掌握 Matplotlib 的使用無疑是最重要的準備工作之一

在使用 Notebook 環境繪圖時,需要先運行 Jupyter Notebook 的魔術命令 %matplotlib inline

這條命令的作用是將 Matplotlib 繪制的圖形嵌入在當前頁面中。而在桌面環境中繪圖時,不需要添加此命令,而是在全部繪圖代碼之後追加 plt.show()

簡單圖形繪制

使用 Matplotlib 提供的面向對象 API,需要導入 pyplot 模塊,並約定簡稱為 plt

快速上手

import  matplotlib.pyplot as plt
%matplotlib inline
plt.plot([1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1])

前面,我們從 Matplotlib 中導入瞭 pyplot 繪圖模塊,並將其簡稱為 plt

pyplot 模塊是 Matplotlib 最核心的模塊,幾乎所有樣式的 2D 圖形都是經過該模塊繪制出來的

自定義X/Y軸

plt.plot()pyplot 模塊下面的直線繪制(折線圖)方法類. 示例中包含瞭一個 [1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1] 列表,Matplotlib 會默認將該列表作為 y 值,而 x 值會從 0 開始依次遞增。

當然,如果你需要自定義橫坐標值,隻需要傳入兩個列表即可

plt.plot([1,2,3],
         [1, 2, 3])

圖表實現

匯總

上面演示瞭如何繪制一個簡單的折線圖

那麼,除瞭折線圖,我們平常還要繪制柱狀圖、散點圖、餅狀圖等等. 這些圖應該怎樣繪制呢?

pyplot 模塊中 pyplot.plot 方法是用來繪制折線圖的

你應該會很容易聯想到,更改後面的方法類名就可以更改圖形的樣式。

的確,在 Matplotlib 中,大部分圖形樣式的繪制方法都存在於 pyplot 模塊中。例如:

方法 含義
matplotlib.pyplot.plot 折線圖
matplotlib.pyplot.angle_spectrum 電子波譜圖
matplotlib.pyplot.bar 柱狀圖
matplotlib.pyplot.barh 直方圖
matplotlib.pyplot.broken_barh 水平直方圖
matplotlib.pyplot.contour 等高線圖
matplotlib.pyplot.errorbar 誤差線
matplotlib.pyplot.hexbin 六邊形圖案
matplotlib.pyplot.hist 柱形圖
matplotlib.pyplot.hist2d 水平柱狀圖
matplotlib.pyplot.pie 餅狀圖
matplotlib.pyplot.quiver 量場圖
matplotlib.pyplot.scatter 散點圖
matplotlib.pyplot.specgram 光譜圖

下面,我們參考折線圖的繪制方法,嘗試繪制幾個簡單的圖形。

正弦曲線圖

matplotlib.pyplot.plot(*args, **kwargs) 方法嚴格來講可以繪制線形圖或者樣本標記

其中,*args 允許輸入單個 y 值或 x,y 值

例如,我們這裡繪制一張自定義 x,y 的正弦曲線圖

import numpy as np

# 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標
X = np.linspace(-2*np.pi, 2*np.pi, 1000)
# 計算 y 坐標
y = np.sin(X)

# 向方法中 `*args` 輸入 X,y 坐標
plt.plot(X, y)

正弦曲線就繪制出來瞭。但值得註意的是,pyplot.plot 在這裡繪制的正弦曲線,實際上不是嚴格意義上的曲線圖,而在兩點之間依舊是直線。

這裡看起來像曲線是因為樣本點相互挨得很近。

柱狀圖

柱形圖 matplotlib.pyplot.bar(*args, **kwargs) 大傢應該都非常瞭解瞭

這裡,我們直接用上面的代碼,僅把 plt.plot(X, y) 改成 plt.bar(X, y) 試一下

plt.bar([1,2,3],[1,2,3])

散點圖

散點圖 matplotlib.pyplot.scatter(*args, **kwargs) 就是呈現在二維平面的一些點,這種圖像的需求也是非常常見的

比如,我們通過 GPS 采集的數據點,它會包含經度以及緯度兩個值,這樣的情況就可以繪制成散點圖

# X,y 的坐標均有 numpy 在 0 到 1 中隨機生成 1000 個值
X = np.random.ranf(1000)
y = np.random.ranf(1000)
# 向方法中 `*args` 輸入 X,y 坐標
plt.scatter(X, y)

餅圖

餅狀圖 matplotlib.pyplot.pie(*args, **kwargs) 在有限列表以百分比呈現時特別有用,你可以很清晰地看出來各類別之間的大小關系,以及各類別占總體的比例。

plt.pie([1, 2, 3, 4, 5])

量場圖

量場圖 matplotlib.pyplot.quiver(*args, **kwargs) 就是由向量組成的圖像,在氣象學等方面被廣泛應用

從圖像的角度來看,量場圖就是帶方向的箭頭符號

X, y = np.mgrid[0:10, 0:10]
plt.quiver(X, y)

等高線圖

中學學習地理的時候,我們就知道等高線瞭

等高線圖 matplotlib.pyplot.contourf(*args, **kwargs) 是工程領域經常接觸的一類圖,它的繪制過程稍微復雜一些

# 生成網格矩陣
x = np.linspace(-5, 5, 500)
y = np.linspace(-5, 5, 500)
X, Y = np.meshgrid(x, y)
# 等高線計算公式
Z = (1 - X / 2 + X ** 3 + Y ** 4) * np.exp(-X ** 2 - Y ** 2)

plt.contourf(X, Y, Z)

圖形樣式

上面,我們繪制瞭簡單的基礎圖形,但這些圖形都不美觀

我們已經知道瞭,線形圖通過 matplotlib.pyplot.plot(*args, **kwargs) 方法繪出

其中,args 代表數據輸入,而 kwargs 的部分就是用於設置樣式參數瞭。

折線圖

二維線形圖 包含的參數 超過 40 餘項,其中常用的也有 10 餘項,選取一些比較有代表性的參數列舉如下:

參數 含義
alpha= 設置線型的透明度,從 0.0 到 1.0
color= 設置線型的顏色
fillstyle= 設置線型的填充樣式
linestyle= 設置線型的樣式
linewidth= 設置線型的寬度
marker= 設置標記點的樣式
…… ……

至於每一項參數包含的設置選項,大傢需要通過 官方文檔 詳細瞭解

下面,我們重新繪制一個三角函數圖形

# 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標
X = np.linspace(-2 * np.pi, 2 * np.pi, 1000)
# 計算 sin() 對應的縱坐標
y1 = np.sin(X)
# 計算 cos() 對應的縱坐標
y2 = np.cos(X)

# 向方法中 `*args` 輸入 X,y 坐標
plt.plot(X, y1, color='r', linestyle='--', linewidth=2, alpha=0.8)
plt.plot(X, y2, color='b', linestyle='-', linewidth=2)

散點圖

散點圖也是相似的,它們的很多樣式參數都是大同小異,需要大傢閱讀 官方文檔 詳細瞭解。

參數 含義
s= 散點大小
c= 散點顏色
marker= 散點樣式
cmap= 定義多類別散點的顏色
alpha= 點的透明度
edgecolors= 散點邊緣顏色
# 生成隨機數據
x = np.random.rand(1000)
y = np.random.rand(1000)
colors = np.random.rand(1000)
size = np.random.normal(50, 60, 1000)
# 繪制散點圖
plt.scatter(x, y, s=size, c=colors)  

餅圖

餅狀圖通過 matplotlib.pyplot.pie() 繪出

我們也可以進一步設置它的顏色、標簽、陰影等各類樣式

# 各類別標簽
label = 'a','b','c','d'  
# 各類別顏色
color = 'r', 'g', 'r', 'g'
# 各類別占比
size = [1, 2, 3, 4]  
# 各類別的偏移半徑
explode = (0, 0, 0, 0, 0.2)  
# 繪制餅狀圖
plt.pie(size, colors=color, explode=explode,
        labels=label, shadow=True, autopct='%1.1f%%')
# 餅狀圖呈正圓
plt.axis('equal')

組合圖形樣式

上面演示瞭單個簡單圖像的繪制

實際上,我們往往會遇到將幾種類型的一樣的圖放在一張圖內顯示,也就是組合圖的繪制。

其實很簡單,你隻需要將所需圖形的代碼放置在一起就可以瞭,比如繪制一張包含柱形圖和折線圖的組合圖。

x = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
y_bar = [3, 4, 6, 8, 9, 10, 9, 11, 7, 8]
y_line = [2, 3, 5, 7, 8, 9, 8, 10, 6, 7]

plt.bar(x, y_bar)
plt.plot(x, y_line, '-o', color='y')

圖形位置

figure對象

在圖形的繪制過程中,你可能需要調整圖形的位置,或者把幾張單獨的圖形拼接在一起

此時,我們就需要引入 plt.figure 圖形對象瞭

# 生成數據
x = np.linspace(0, 10, 20)
y = x * x + 2

# 新建圖形對象
fig = plt.figure()
# 控制畫佈的左, 下, 寬度, 高度
axes = fig.add_axes([0.5, 0.5, 0.8, 0.8])
axes.plot(x, y, 'r')

上面的繪圖代碼中,你可能會對 figureaxes 產生疑問

Matplotlib 的 API 設計的非常符合常理,在這裡,figure 相當於繪畫用的畫板,而 axes 則相當於鋪在畫板上的畫佈

我們將圖像繪制在畫佈上,於是就有瞭 plotset_xlabel 等操作。

借助於圖形對象,我們可以實現大圖套小圖的效果

# 新建畫板
fig = plt.figure()

# 大畫佈
axes1 = fig.add_axes([0.1,0.1,0.8,0.8])
# 小畫佈
axes2 = fig.add_axes([0.2,0.5,0.4,0.3])

# 大畫佈
axes1.plot(x,y,'r')
# 小畫佈
axes2.plot(x,y,'g')

上面的繪圖代碼中,使用瞭 add_axes() 方法向我們設置的畫板 figure 中添加畫佈 axes

subplots對象

在 Matplotlib 中,還有一種添加畫佈的方式,那就是 plt.subplots(),它和 axes 都等同於畫佈

flg,axes = plt.subplots()
axes.plot(x,y,'r')

借助於 plt.subplots(),我們就可以實現子圖的繪制,也就是將多張圖按一定順序拼接在一起

# 子圖為 1 行,2 列
flg,axes = plt.subplots(nrows=1,ncols=2)
for ax in axes:
    ax.plot(x,y,'r')

或者:

x = [1,2,3]
y = [1,2,3]

flg,axes = plt.subplots(nrows=1,ncols=2)
axes[0].plot(x,y,'r')
axes[1].plot(x[::-1],y,'r')

通過設置 plt.subplots 的參數,可以實現調節畫佈尺寸和顯示精度

fig, axes = plt.subplots(
        # 通過 figsize 調節尺寸, dpi 調節顯示精度
    	figsize=(16, 9), dpi=50
	) 

axes.plot(x, y, 'r')

規范繪圖方法

首先,任何圖形的繪制,都建議通過 plt.figure() 或者 plt.subplots() 管理一個完整的圖形對象

而不是簡單使用一條語句,例如 plt.plot(...) 來繪圖

管理一個完整的圖形對象,有很多好處, 在圖形的基礎上,給後期添加圖例,圖形樣式,標註等預留瞭很大的空間, 除此之外代碼看起來也更加規范,可讀性更強.

接下來,我們就通過幾組例子來演示規范的繪圖方法.

添加圖標題/圖例

繪制包含圖標題、坐標軸標題以及圖例的圖形,舉例如下:

fig, axes = plt.subplots()

# 橫軸名稱
axes.set_xlabel('x label')  
axes.set_ylabel('y label')

# 圖形名稱
axes.set_title('title')  

axes.plot(x, x**2)
axes.plot(x, x**3)
# 圖例
axes.legend(["y = x**2", "y = x**3"], loc=0)  

圖例中的 loc 參數標記圖例位置,1,2,3,4 依次代表:右上角、左上角、左下角,右下角;0 代表自適應

線型、顏色、透明度

在 Matplotlib 中,你可以設置線的顏色、透明度等其他屬性

fig,axes = plt.subplots()

axes.plot(x, x+1, color="red", alpha=0.5)
axes.plot(x, x+2, color="#1155dd")
axes.plot(x, x+3, color="#15cc55")

而對於線型而言,除瞭實線、虛線之外,還有很多豐富的線型可供選擇

fig, ax = plt.subplots(figsize=(12, 6))

# 線寬
ax.plot(x, x+1, color="blue", linewidth=0.25)
ax.plot(x, x+2, color="blue", linewidth=0.50)
ax.plot(x, x+3, color="blue", linewidth=1.00)
ax.plot(x, x+4, color="blue", linewidth=2.00)

# 虛線類型
ax.plot(x, x+5, color="red", lw=2, linestyle='-')
ax.plot(x, x+6, color="red", lw=2, ls='-.')
ax.plot(x, x+7, color="red", lw=2, ls=':')

# 虛線交錯寬度
line, = ax.plot(x, x+8, color="black", lw=1.50)
line.set_dashes([5, 10, 15, 10])

# 符號
ax.plot(x, x + 9, color="green", lw=2, ls='--', marker='+')
ax.plot(x, x+10, color="green", lw=2, ls='--', marker='o')
ax.plot(x, x+11, color="green", lw=2, ls='--', marker='s')
ax.plot(x, x+12, color="green", lw=2, ls='--', marker='1')

# 符號大小和顏色
ax.plot(x, x+13, color="purple", lw=1, ls='-', marker='o', markersize=2)
ax.plot(x, x+14, color="purple", lw=1, ls='-', marker='o', markersize=4)
ax.plot(x, x+15, color="purple", lw=1, ls='-',
        marker='o', markersize=8, markerfacecolor="red")
ax.plot(x, x+16, color="purple", lw=1, ls='-', marker='s', markersize=8,
        markerfacecolor="yellow", markeredgewidth=2, markeredgecolor="blue")

畫佈網格、坐標軸范圍

有些時候,我們可能需要顯示畫佈網格或調整坐標軸范圍

設置畫佈網格和坐標軸范圍

這裡,我們通過指定 axes[0] 序號,來實現子圖的自定義順序排列

fig, axes = plt.subplots(1, 2, figsize=(10, 5))

# 顯示網格
axes[0].plot(x, x**2, x, x**3, lw=2)
axes[0].grid(True)

# 設置坐標軸范圍
axes[1].plot(x, x**2, x, x**3)
axes[1].set_ylim([0, 60])
axes[1].set_xlim([2, 5])

除瞭折線圖,Matplotlib 還支持繪制散點圖、柱狀圖等其他常見圖形

下面,我們繪制由散點圖、梯步圖、條形圖、面積圖構成的子圖

n = np.array([0, 1, 2, 3, 4, 5])

fig, axes = plt.subplots(1, 4, figsize=(16, 5))

axes[0].scatter(x, x + 0.25*np.random.randn(len(x)))
axes[0].set_title("scatter")

axes[1].step(n, n**2, lw=2)
axes[1].set_title("step")

axes[2].bar(n, n**2, align="center", width=0.5, alpha=0.5)
axes[2].set_title("bar")

axes[3].fill_between(x, x**2, x**3, color="green", alpha=0.5)
axes[3].set_title("fill_between")

圖形標註方法

當我們繪制一些較為復雜的圖像時,閱讀對象往往很難全面理解圖像的含義。而此時,圖像標註往往會起到畫龍點睛的效果

圖像標註,就是在畫面上添加文字註釋、指示箭頭、圖框等各類標註元素

Matplotlib 中,文字標註的方法由 matplotlib.pyplot.text() 實現

最基本的樣式為 matplotlib.pyplot.text(x, y, s),其中 x, y 用於標註位置定位,s 代表標註的字符串

除此之外,你還可以通過 fontsize= , horizontalalignment= 等參數調整標註字體的大小,對齊樣式等

下面,我們舉一個對柱形圖進行文字標註的示例

fig,axes = plt.subplots()

# 柱形圖橫坐標
x_bar = [
    10,20,30,40,50
]
# 柱形圖縱坐標
y_bar = [
    0.5,0.6,0.3,0.4,0.8
]

# 繪制柱形圖
bars = axes.bar(x_bar,y_bar,color="blue",label=x_bar,width=2)

for i,rect in enumerate(bars):
    # 獲取柱形圖縱坐標
    x_text = rect.get_x()
    # 獲取柱子的高度並增加0.01
    y_text = rect.get_height() + 0.01
    # 標註文字
    plt.text(x_text,y_text,'%.1f' % y_bar[i])

除瞭文字標註之外,還可以通過 matplotlib.pyplot.annotate() 方法向圖像中添加箭頭等樣式標註

接下來,我們向上面的例子中增添一行增加箭頭標記的代碼

for i, rect in enumerate(bars):
    # 獲取柱形圖縱坐標
    x_text = rect.get_x()
    # 獲取柱子的高度並增加0.01
    y_text = rect.get_height() + 0.01
    # 標註文字
    plt.text(x_text, y_text, '%.1f' % y_bar[i])
	
    # 增加箭頭標註
    plt.annotate(
        'Min', xy=(32, 0.3), xytext=(36, 0.3),
        arrowprops=dict(facecolor='black', width=1, headwidth=7)
    )

上面的示例中,xy=() 表示標註終點坐標,xytext=() 表示標註起點坐標

在箭頭繪制的過程中,arrowprops=() 用於設置箭頭樣式,facecolor= 設置顏色,width= 設置箭尾寬度,headwidth= 設置箭頭寬度,可以通過 arrowstyle= 改變箭頭的樣式。

以上就是手把手教你用Matplotlib實現數據可視化的詳細內容,更多關於Matplotlib數據可視化的資料請關註WalkonNet其它相關文章!

推薦閱讀: