手把手教你用Matplotlib實現數據可視化
介紹
在使用機器學習方法解決問題的過程中,一定會遇到需要針對數據進行繪圖的場景。
Matplotlib 是支持 Python 語言的開源繪圖庫,因為其支持豐富的繪圖類型、簡單的繪圖方式以及完善的接口文檔,深受 Python 工程師、科研學者、數據工程師等各類人士的喜歡
Matplotlib 擁有著十分活躍的社區以及穩定的版本迭代,當我們在學習機器學習的課程時,掌握 Matplotlib 的使用無疑是最重要的準備工作之一
在使用 Notebook 環境繪圖時,需要先運行 Jupyter Notebook 的魔術命令 %matplotlib inline
這條命令的作用是將 Matplotlib 繪制的圖形嵌入在當前頁面中。而在桌面環境中繪圖時,不需要添加此命令,而是在全部繪圖代碼之後追加 plt.show()
簡單圖形繪制
使用 Matplotlib 提供的面向對象 API,需要導入 pyplot
模塊,並約定簡稱為 plt
快速上手
import matplotlib.pyplot as plt %matplotlib inline plt.plot([1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1])
前面,我們從 Matplotlib 中導入瞭 pyplot
繪圖模塊,並將其簡稱為 plt
pyplot
模塊是 Matplotlib 最核心的模塊,幾乎所有樣式的 2D 圖形都是經過該模塊繪制出來的
自定義X/Y軸
plt.plot()
是 pyplot
模塊下面的直線繪制(折線圖)方法類. 示例中包含瞭一個 [1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1]
列表,Matplotlib 會默認將該列表作為 y 值,而 x 值會從 0 開始依次遞增。
當然,如果你需要自定義橫坐標值,隻需要傳入兩個列表即可
plt.plot([1,2,3], [1, 2, 3])
圖表實現
匯總
上面演示瞭如何繪制一個簡單的折線圖
那麼,除瞭折線圖,我們平常還要繪制柱狀圖、散點圖、餅狀圖等等. 這些圖應該怎樣繪制呢?
pyplot
模塊中 pyplot.plot
方法是用來繪制折線圖的
你應該會很容易聯想到,更改後面的方法類名就可以更改圖形的樣式。
的確,在 Matplotlib 中,大部分圖形樣式的繪制方法都存在於 pyplot 模塊中。例如:
方法 | 含義 |
---|---|
matplotlib.pyplot.plot | 折線圖 |
matplotlib.pyplot.angle_spectrum | 電子波譜圖 |
matplotlib.pyplot.bar | 柱狀圖 |
matplotlib.pyplot.barh | 直方圖 |
matplotlib.pyplot.broken_barh | 水平直方圖 |
matplotlib.pyplot.contour | 等高線圖 |
matplotlib.pyplot.errorbar | 誤差線 |
matplotlib.pyplot.hexbin | 六邊形圖案 |
matplotlib.pyplot.hist | 柱形圖 |
matplotlib.pyplot.hist2d | 水平柱狀圖 |
matplotlib.pyplot.pie | 餅狀圖 |
matplotlib.pyplot.quiver | 量場圖 |
matplotlib.pyplot.scatter | 散點圖 |
matplotlib.pyplot.specgram | 光譜圖 |
下面,我們參考折線圖的繪制方法,嘗試繪制幾個簡單的圖形。
正弦曲線圖
matplotlib.pyplot.plot(*args, **kwargs)
方法嚴格來講可以繪制線形圖或者樣本標記
其中,*args
允許輸入單個 y 值或 x,y 值
例如,我們這裡繪制一張自定義 x,y 的正弦曲線圖
import numpy as np # 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標 X = np.linspace(-2*np.pi, 2*np.pi, 1000) # 計算 y 坐標 y = np.sin(X) # 向方法中 `*args` 輸入 X,y 坐標 plt.plot(X, y)
正弦曲線就繪制出來瞭。但值得註意的是,pyplot.plot
在這裡繪制的正弦曲線,實際上不是嚴格意義上的曲線圖,而在兩點之間依舊是直線。
這裡看起來像曲線是因為樣本點相互挨得很近。
柱狀圖
柱形圖 matplotlib.pyplot.bar(*args, **kwargs)
大傢應該都非常瞭解瞭
這裡,我們直接用上面的代碼,僅把 plt.plot(X, y)
改成 plt.bar(X, y)
試一下
plt.bar([1,2,3],[1,2,3])
散點圖
散點圖 matplotlib.pyplot.scatter(*args, **kwargs)
就是呈現在二維平面的一些點,這種圖像的需求也是非常常見的
比如,我們通過 GPS 采集的數據點,它會包含經度以及緯度兩個值,這樣的情況就可以繪制成散點圖
# X,y 的坐標均有 numpy 在 0 到 1 中隨機生成 1000 個值 X = np.random.ranf(1000) y = np.random.ranf(1000) # 向方法中 `*args` 輸入 X,y 坐標 plt.scatter(X, y)
餅圖
餅狀圖 matplotlib.pyplot.pie(*args, **kwargs)
在有限列表以百分比呈現時特別有用,你可以很清晰地看出來各類別之間的大小關系,以及各類別占總體的比例。
plt.pie([1, 2, 3, 4, 5])
量場圖
量場圖 matplotlib.pyplot.quiver(*args, **kwargs)
就是由向量組成的圖像,在氣象學等方面被廣泛應用
從圖像的角度來看,量場圖就是帶方向的箭頭符號
X, y = np.mgrid[0:10, 0:10] plt.quiver(X, y)
等高線圖
中學學習地理的時候,我們就知道等高線瞭
等高線圖 matplotlib.pyplot.contourf(*args, **kwargs)
是工程領域經常接觸的一類圖,它的繪制過程稍微復雜一些
# 生成網格矩陣 x = np.linspace(-5, 5, 500) y = np.linspace(-5, 5, 500) X, Y = np.meshgrid(x, y) # 等高線計算公式 Z = (1 - X / 2 + X ** 3 + Y ** 4) * np.exp(-X ** 2 - Y ** 2) plt.contourf(X, Y, Z)
圖形樣式
上面,我們繪制瞭簡單的基礎圖形,但這些圖形都不美觀
我們已經知道瞭,線形圖通過 matplotlib.pyplot.plot(*args, **kwargs)
方法繪出
其中,args
代表數據輸入,而 kwargs 的部分就是用於設置樣式參數瞭。
折線圖
二維線形圖 包含的參數 超過 40 餘項,其中常用的也有 10 餘項,選取一些比較有代表性的參數列舉如下:
參數 | 含義 |
---|---|
alpha= | 設置線型的透明度,從 0.0 到 1.0 |
color= | 設置線型的顏色 |
fillstyle= | 設置線型的填充樣式 |
linestyle= | 設置線型的樣式 |
linewidth= | 設置線型的寬度 |
marker= | 設置標記點的樣式 |
…… | …… |
至於每一項參數包含的設置選項,大傢需要通過 官方文檔 詳細瞭解
下面,我們重新繪制一個三角函數圖形
# 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標 X = np.linspace(-2 * np.pi, 2 * np.pi, 1000) # 計算 sin() 對應的縱坐標 y1 = np.sin(X) # 計算 cos() 對應的縱坐標 y2 = np.cos(X) # 向方法中 `*args` 輸入 X,y 坐標 plt.plot(X, y1, color='r', linestyle='--', linewidth=2, alpha=0.8) plt.plot(X, y2, color='b', linestyle='-', linewidth=2)
散點圖
散點圖也是相似的,它們的很多樣式參數都是大同小異,需要大傢閱讀 官方文檔 詳細瞭解。
參數 | 含義 |
---|---|
s= | 散點大小 |
c= | 散點顏色 |
marker= | 散點樣式 |
cmap= | 定義多類別散點的顏色 |
alpha= | 點的透明度 |
edgecolors= | 散點邊緣顏色 |
# 生成隨機數據 x = np.random.rand(1000) y = np.random.rand(1000) colors = np.random.rand(1000) size = np.random.normal(50, 60, 1000) # 繪制散點圖 plt.scatter(x, y, s=size, c=colors)
餅圖
餅狀圖通過 matplotlib.pyplot.pie()
繪出
我們也可以進一步設置它的顏色、標簽、陰影等各類樣式
# 各類別標簽 label = 'a','b','c','d' # 各類別顏色 color = 'r', 'g', 'r', 'g' # 各類別占比 size = [1, 2, 3, 4] # 各類別的偏移半徑 explode = (0, 0, 0, 0, 0.2) # 繪制餅狀圖 plt.pie(size, colors=color, explode=explode, labels=label, shadow=True, autopct='%1.1f%%') # 餅狀圖呈正圓 plt.axis('equal')
組合圖形樣式
上面演示瞭單個簡單圖像的繪制
實際上,我們往往會遇到將幾種類型的一樣的圖放在一張圖內顯示,也就是組合圖的繪制。
其實很簡單,你隻需要將所需圖形的代碼放置在一起就可以瞭,比如繪制一張包含柱形圖和折線圖的組合圖。
x = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19] y_bar = [3, 4, 6, 8, 9, 10, 9, 11, 7, 8] y_line = [2, 3, 5, 7, 8, 9, 8, 10, 6, 7] plt.bar(x, y_bar) plt.plot(x, y_line, '-o', color='y')
圖形位置
figure對象
在圖形的繪制過程中,你可能需要調整圖形的位置,或者把幾張單獨的圖形拼接在一起
此時,我們就需要引入 plt.figure
圖形對象瞭
# 生成數據 x = np.linspace(0, 10, 20) y = x * x + 2 # 新建圖形對象 fig = plt.figure() # 控制畫佈的左, 下, 寬度, 高度 axes = fig.add_axes([0.5, 0.5, 0.8, 0.8]) axes.plot(x, y, 'r')
上面的繪圖代碼中,你可能會對 figure
和 axes
產生疑問
Matplotlib 的 API 設計的非常符合常理,在這裡,figure
相當於繪畫用的畫板,而 axes
則相當於鋪在畫板上的畫佈
我們將圖像繪制在畫佈上,於是就有瞭 plot
,set_xlabel
等操作。
借助於圖形對象,我們可以實現大圖套小圖的效果
# 新建畫板 fig = plt.figure() # 大畫佈 axes1 = fig.add_axes([0.1,0.1,0.8,0.8]) # 小畫佈 axes2 = fig.add_axes([0.2,0.5,0.4,0.3]) # 大畫佈 axes1.plot(x,y,'r') # 小畫佈 axes2.plot(x,y,'g')
上面的繪圖代碼中,使用瞭 add_axes()
方法向我們設置的畫板 figure
中添加畫佈 axes
subplots對象
在 Matplotlib 中,還有一種添加畫佈的方式,那就是 plt.subplots()
,它和 axes
都等同於畫佈
flg,axes = plt.subplots() axes.plot(x,y,'r')
借助於 plt.subplots()
,我們就可以實現子圖的繪制,也就是將多張圖按一定順序拼接在一起
# 子圖為 1 行,2 列 flg,axes = plt.subplots(nrows=1,ncols=2) for ax in axes: ax.plot(x,y,'r')
或者:
x = [1,2,3] y = [1,2,3] flg,axes = plt.subplots(nrows=1,ncols=2) axes[0].plot(x,y,'r') axes[1].plot(x[::-1],y,'r')
通過設置 plt.subplots
的參數,可以實現調節畫佈尺寸和顯示精度
fig, axes = plt.subplots( # 通過 figsize 調節尺寸, dpi 調節顯示精度 figsize=(16, 9), dpi=50 ) axes.plot(x, y, 'r')
規范繪圖方法
首先,任何圖形的繪制,都建議通過 plt.figure()
或者 plt.subplots()
管理一個完整的圖形對象
而不是簡單使用一條語句,例如 plt.plot(...)
來繪圖
管理一個完整的圖形對象,有很多好處, 在圖形的基礎上,給後期添加圖例,圖形樣式,標註等預留瞭很大的空間, 除此之外代碼看起來也更加規范,可讀性更強.
接下來,我們就通過幾組例子來演示規范的繪圖方法.
添加圖標題/圖例
繪制包含圖標題、坐標軸標題以及圖例的圖形,舉例如下:
fig, axes = plt.subplots() # 橫軸名稱 axes.set_xlabel('x label') axes.set_ylabel('y label') # 圖形名稱 axes.set_title('title') axes.plot(x, x**2) axes.plot(x, x**3) # 圖例 axes.legend(["y = x**2", "y = x**3"], loc=0)
圖例中的 loc
參數標記圖例位置,1,2,3,4
依次代表:右上角、左上角、左下角,右下角;0
代表自適應
線型、顏色、透明度
在 Matplotlib 中,你可以設置線的顏色、透明度等其他屬性
fig,axes = plt.subplots() axes.plot(x, x+1, color="red", alpha=0.5) axes.plot(x, x+2, color="#1155dd") axes.plot(x, x+3, color="#15cc55")
而對於線型而言,除瞭實線、虛線之外,還有很多豐富的線型可供選擇
fig, ax = plt.subplots(figsize=(12, 6)) # 線寬 ax.plot(x, x+1, color="blue", linewidth=0.25) ax.plot(x, x+2, color="blue", linewidth=0.50) ax.plot(x, x+3, color="blue", linewidth=1.00) ax.plot(x, x+4, color="blue", linewidth=2.00) # 虛線類型 ax.plot(x, x+5, color="red", lw=2, linestyle='-') ax.plot(x, x+6, color="red", lw=2, ls='-.') ax.plot(x, x+7, color="red", lw=2, ls=':') # 虛線交錯寬度 line, = ax.plot(x, x+8, color="black", lw=1.50) line.set_dashes([5, 10, 15, 10]) # 符號 ax.plot(x, x + 9, color="green", lw=2, ls='--', marker='+') ax.plot(x, x+10, color="green", lw=2, ls='--', marker='o') ax.plot(x, x+11, color="green", lw=2, ls='--', marker='s') ax.plot(x, x+12, color="green", lw=2, ls='--', marker='1') # 符號大小和顏色 ax.plot(x, x+13, color="purple", lw=1, ls='-', marker='o', markersize=2) ax.plot(x, x+14, color="purple", lw=1, ls='-', marker='o', markersize=4) ax.plot(x, x+15, color="purple", lw=1, ls='-', marker='o', markersize=8, markerfacecolor="red") ax.plot(x, x+16, color="purple", lw=1, ls='-', marker='s', markersize=8, markerfacecolor="yellow", markeredgewidth=2, markeredgecolor="blue")
畫佈網格、坐標軸范圍
有些時候,我們可能需要顯示畫佈網格或調整坐標軸范圍
設置畫佈網格和坐標軸范圍
這裡,我們通過指定 axes[0]
序號,來實現子圖的自定義順序排列
fig, axes = plt.subplots(1, 2, figsize=(10, 5)) # 顯示網格 axes[0].plot(x, x**2, x, x**3, lw=2) axes[0].grid(True) # 設置坐標軸范圍 axes[1].plot(x, x**2, x, x**3) axes[1].set_ylim([0, 60]) axes[1].set_xlim([2, 5])
除瞭折線圖,Matplotlib 還支持繪制散點圖、柱狀圖等其他常見圖形
下面,我們繪制由散點圖、梯步圖、條形圖、面積圖構成的子圖
n = np.array([0, 1, 2, 3, 4, 5]) fig, axes = plt.subplots(1, 4, figsize=(16, 5)) axes[0].scatter(x, x + 0.25*np.random.randn(len(x))) axes[0].set_title("scatter") axes[1].step(n, n**2, lw=2) axes[1].set_title("step") axes[2].bar(n, n**2, align="center", width=0.5, alpha=0.5) axes[2].set_title("bar") axes[3].fill_between(x, x**2, x**3, color="green", alpha=0.5) axes[3].set_title("fill_between")
圖形標註方法
當我們繪制一些較為復雜的圖像時,閱讀對象往往很難全面理解圖像的含義。而此時,圖像標註往往會起到畫龍點睛的效果
圖像標註,就是在畫面上添加文字註釋、指示箭頭、圖框等各類標註元素
Matplotlib 中,文字標註的方法由 matplotlib.pyplot.text()
實現
最基本的樣式為 matplotlib.pyplot.text(x, y, s)
,其中 x, y 用於標註位置定位,s 代表標註的字符串
除此之外,你還可以通過 fontsize=
, horizontalalignment=
等參數調整標註字體的大小,對齊樣式等
下面,我們舉一個對柱形圖進行文字標註的示例
fig,axes = plt.subplots() # 柱形圖橫坐標 x_bar = [ 10,20,30,40,50 ] # 柱形圖縱坐標 y_bar = [ 0.5,0.6,0.3,0.4,0.8 ] # 繪制柱形圖 bars = axes.bar(x_bar,y_bar,color="blue",label=x_bar,width=2) for i,rect in enumerate(bars): # 獲取柱形圖縱坐標 x_text = rect.get_x() # 獲取柱子的高度並增加0.01 y_text = rect.get_height() + 0.01 # 標註文字 plt.text(x_text,y_text,'%.1f' % y_bar[i])
除瞭文字標註之外,還可以通過 matplotlib.pyplot.annotate()
方法向圖像中添加箭頭等樣式標註
接下來,我們向上面的例子中增添一行增加箭頭標記的代碼
for i, rect in enumerate(bars): # 獲取柱形圖縱坐標 x_text = rect.get_x() # 獲取柱子的高度並增加0.01 y_text = rect.get_height() + 0.01 # 標註文字 plt.text(x_text, y_text, '%.1f' % y_bar[i]) # 增加箭頭標註 plt.annotate( 'Min', xy=(32, 0.3), xytext=(36, 0.3), arrowprops=dict(facecolor='black', width=1, headwidth=7) )
上面的示例中,xy=()
表示標註終點坐標,xytext=()
表示標註起點坐標
在箭頭繪制的過程中,arrowprops=()
用於設置箭頭樣式,facecolor=
設置顏色,width=
設置箭尾寬度,headwidth=
設置箭頭寬度,可以通過 arrowstyle=
改變箭頭的樣式。
以上就是手把手教你用Matplotlib實現數據可視化的詳細內容,更多關於Matplotlib數據可視化的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Python數據分析之matplotlib繪圖詳解
- Python Matplotlib繪圖基礎詳細教程
- 詳解Python中matplotlib模塊的繪圖方式
- Python Matplotlib數據可視化模塊使用詳解
- Python Matplotlib初階使用入門教程