matplotlib bar()實現多組數據並列柱狀圖通用簡便創建方法
在使用柱狀圖時,經常遇到需要多組數據進行比較的情況。
繪制單個數據系列的柱形圖比較簡單,多組數據柱狀圖繪制的關鍵有三點:
- 多次調用bar()函數即可在同一子圖中繪制多組柱形圖。
- 為瞭防止柱子重疊,每個柱子在x軸上的位置需要依次遞增,如果柱子緊挨,這個距離即柱子寬度。
- 為瞭使刻度標簽居中,需要調整x軸刻度標簽的位置。
由上述可知,多組數據並列柱狀圖需要計算柱子x
軸上的位置和x
軸刻度標簽。
因此,有兩種實現方案:
x
軸刻度標簽位置固定,根據x
軸刻度計算每個柱子的寬度- 每個柱子的寬度固定,計算
x
軸刻度標簽位置,使之居中
下面使用第一種方法演示兩組數據、三組數據、四組數據的並列柱狀圖。
使用方法一、方法二演示通用多組並列柱狀圖的創建方法。
兩組數據、三組數據、四組數據的並列柱狀圖
import matplotlib import matplotlib.pyplot as plt import numpy as np plt.figure(figsize=(13, 4)) # 構造x軸刻度標簽、數據 labels = ['G1', 'G2', 'G3', 'G4', 'G5'] first = [20, 34, 30, 35, 27] second = [25, 32, 34, 20, 25] third = [21, 31, 37, 21, 28] fourth = [26, 31, 35, 27, 21] # 兩組數據 plt.subplot(131) x = np.arange(len(labels)) # x軸刻度標簽位置 width = 0.25 # 柱子的寬度 # 計算每個柱子在x軸上的位置,保證x軸刻度標簽居中 # x - width/2,x + width/2即每組數據在x軸上的位置 plt.bar(x - width/2, first, width, label='1') plt.bar(x + width/2, second, width, label='2') plt.ylabel('Scores') plt.title('2 datasets') # x軸刻度標簽位置不進行計算 plt.xticks(x, labels=labels) plt.legend() # 三組數據 plt.subplot(132) x = np.arange(len(labels)) # x軸刻度標簽位置 width = 0.25 # 柱子的寬度 # 計算每個柱子在x軸上的位置,保證x軸刻度標簽居中 # x - width,x, x + width即每組數據在x軸上的位置 plt.bar(x - width, first, width, label='1') plt.bar(x, second, width, label='2') plt.bar(x + width, third, width, label='3') plt.ylabel('Scores') plt.title('3 datasets') # x軸刻度標簽位置不進行計算 plt.xticks(x, labels=labels) plt.legend() # 四組數據 plt.subplot(133) x = np.arange(len(labels)) # x軸刻度標簽位置 width = 0.2 # 柱子的寬度 # 計算每個柱子在x軸上的位置,保證x軸刻度標簽居中 plt.bar(x - 1.5*width, first, width, label='1') plt.bar(x - 0.5*width, second, width, label='2') plt.bar(x + 0.5*width, third, width, label='3') plt.bar(x + 1.5*width, fourth, width, label='4') plt.ylabel('Scores') plt.title('4 datasets') # x軸刻度標簽位置不進行計算 plt.xticks(x, labels=labels) plt.legend() plt.show()
通用多組並列柱狀圖的簡便創建方法
上面的示例比較簡易,有一些問題沒有考慮。為瞭便於重復使用,下面的通用方法可調整x軸標簽刻度步長、每組柱子的總寬度、每組柱子之間的間隙、組與組之間的間隙。
方法一
import matplotlib import matplotlib.pyplot as plt import numpy as np label = ['G1', 'G2', 'G3', 'G4', 'G5'] first = [20, 34, 30, 35, 27] second = [25, 32, 34, 20, 25] third = [21, 31, 37, 21, 28] fourth = [26, 31, 35, 27, 21] data = [first, second, third, fourth] def create_multi_bars(labels, datas, tick_step=1, group_gap=0.2, bar_gap=0): ''' labels : x軸坐標標簽序列 datas :數據集,二維列表,要求列表每個元素的長度必須與labels的長度一致 tick_step :默認x軸刻度步長為1,通過tick_step可調整x軸刻度步長。 group_gap : 柱子組與組之間的間隙,最好為正值,否則組與組之間重疊 bar_gap :每組柱子之間的空隙,默認為0,每組柱子緊挨,正值每組柱子之間有間隙,負值每組柱子之間重疊 ''' # ticks為x軸刻度 ticks = np.arange(len(labels)) * tick_step # group_num為數據的組數,即每組柱子的柱子個數 group_num = len(datas) # group_width為每組柱子的總寬度,group_gap 為柱子組與組之間的間隙。 group_width = tick_step - group_gap # bar_span為每組柱子之間在x軸上的距離,即柱子寬度和間隙的總和 bar_span = group_width / group_num # bar_width為每個柱子的實際寬度 bar_width = bar_span - bar_gap # baseline_x為每組柱子第一個柱子的基準x軸位置,隨後的柱子依次遞增bar_span即可 baseline_x = ticks - (group_width - bar_span) / 2 for index, y in enumerate(datas): plt.bar(baseline_x + index*bar_span, y, bar_width) plt.ylabel('Scores') plt.title('multi datasets') # x軸刻度標簽位置與x軸刻度一致 plt.xticks(ticks, labels) plt.show() create_multi_bars(label, data, bar_gap=0.1)
方法二
import matplotlib import matplotlib.pyplot as plt import numpy as np label = ['G1', 'G2', 'G3', 'G4', 'G5'] first = [20, 34, 30, 35, 27] second = [25, 32, 34, 20, 25] third = [21, 31, 37, 21, 28] fourth = [26, 31, 35, 27, 21] data = [first, second, third, fourth] def create_multi_bars(labels, datas, tick_step=1, group_gap=0.2, bar_gap=0): ''' labels : x軸坐標標簽序列 datas :數據集,二維列表,要求列表每個元素的長度必須與labels的長度一致 tick_step :默認x軸刻度步長為1,通過tick_step可調整x軸刻度步長。 group_gap : 柱子組與組之間的間隙,最好為正值,否則組與組之間重疊 bar_gap :每組柱子之間的空隙,默認為0,每組柱子緊挨,正值每組柱子之間有間隙,負值每組柱子之間重疊 ''' # x為每組柱子x軸的基準位置 x = np.arange(len(labels)) * tick_step # group_num為數據的組數,即每組柱子的柱子個數 group_num = len(datas) # group_width為每組柱子的總寬度,group_gap 為柱子組與組之間的間隙。 group_width = tick_step - group_gap # bar_span為每組柱子之間在x軸上的距離,即柱子寬度和間隙的總和 bar_span = group_width / group_num # bar_width為每個柱子的實際寬度 bar_width = bar_span - bar_gap # 繪制柱子 for index, y in enumerate(datas): plt.bar(x + index*bar_span, y, bar_width) plt.ylabel('Scores') plt.title('multi datasets') # ticks為新x軸刻度標簽位置,即每組柱子x軸上的中心位置 ticks = x + (group_width - bar_span) / 2 plt.xticks(ticks, labels) plt.show() create_multi_bars(label, data[:3], bar_gap=0.1)
推薦閱讀:
- Python Matplotlib數據可視化模塊使用詳解
- matplotlib基本圖形繪制操作實例
- 教你利用python的matplotlib(pyplot)繪制折線圖和柱狀圖
- Python數據分析應用之Matplotlib數據可視化詳情
- Python數據分析之Matplotlib數據可視化