python 繪制斜率圖進行對比分析
你好,我是林驥。
斜率圖,可以快速展現兩組數據之間各維度的變化,特別適合用於對比兩個時間點的數據。
比如說,為瞭對比分析某產品不同功能的用戶滿意度,經過問卷調查和數據統計,得到下面這個調查結果:
你不妨自己先思考一下,如何對這組數據進行可視化,才能讓信息傳遞變得更加高效?
下面是我用 matplotlib 制作的圖表:
從圖中可以直觀地看出,功能 C 的用戶滿意度明顯下降,我們用比較鮮明的橙色來表示,以便引起觀眾重點關註;功能 D 和功能 E 的用戶滿意度明顯提升,我們用藍色表示,代表數據正在向好的方向發展;功能 A 和功能 B 的用戶滿意度變化不大,我們用淺灰色表示,以便削弱觀眾對這兩個功能的註意力,把更多的精力用於分析用戶滿意度明顯下降的功能點,從而讓圖表起到提升信息傳遞效率的目的。
下面是用 matplotlib 畫圖的詳細步驟。
首先,導入所需的庫,並設置中文字體和定義顏色等。
# 導入所需的庫 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.image as image # 正常顯示中文標簽 mpl.rcParams['font.sans-serif'] = ['SimHei'] # 自動適應佈局 mpl.rcParams.update({'figure.autolayout': True}) # 正常顯示負號 mpl.rcParams['axes.unicode_minus'] = False # 定義顏色,主色:藍色,輔助色:灰色,互補色:橙色 c = {'藍色':'#00589F', '深藍色':'#003867', '淺藍色':'#5D9BCF', '灰色':'#999999', '深灰色':'#666666', '淺灰色':'#CCCCCC', '橙色':'#F68F00', '深橙色':'#A05D00', '淺橙色':'#FBC171'}
其次,從 Excel 文件中讀取隨機模擬的數據,並定義畫圖用的數據。
# 數據源路徑 filepath='./data/問卷調查結果.xlsx' # 讀取 Excel文件 df = pd.read_excel(filepath, index_col='調查年度') # 定義畫圖用的數據 category_names = df.columns labels = df.index data = df.values data_cum = data.cumsum(axis=1)
接下來,開始用「面向對象」的方法進行畫圖。
# 使用「面向對象」的方法畫圖,定義圖片的大小 fig, ax=plt.subplots(figsize=(6, 6)) # 設置背景顏色 fig.set_facecolor('w') ax.set_facecolor('w') # 設置標題 ax.set_title('\n用戶滿意度隨時間的變化\n', fontsize=26, loc='left', color=c['深灰色']) # 定義顏色 category_colors = [c['淺灰色'], c['淺灰色'], c['橙色'], c['藍色'], c['藍色']] # 畫斜率圖 for i, color in zip(np.arange(len(df.columns)), category_colors): ax.plot(df.index, df.iloc[:, i], marker='o', color=color) # 設置數據標簽及其文字顏色 ax.text(-0.03, df.iloc[0, i], df.columns[i] + ' ' + '{:.0%}'.format(df.iloc[0, i]), ha='right', va='center', color=color, fontsize=16) ax.text(1.06, df.iloc[1, i], '{:.0%}'.format(df.iloc[1, i]), ha='left', va='center', color=color, fontsize=16) # 設置 Y 軸刻度范圍 ax.set_ylim(df.values.min()-0.02, df.values.max()+0.01) # 隱藏 Y 軸 ax.yaxis.set_visible(False) # 隱藏邊框 ax.spines['top'].set_visible(False) ax.spines['right'].set_visible(False) ax.spines['left'].set_visible(False) ax.spines['bottom'].set_visible(False) # 隱藏 X 軸的刻度線 ax.tick_params(axis='x', which='major', length=0) # 設置坐標標簽字體大小和顏色 ax.tick_params(labelsize=16, colors=c['灰色']) plt.show()
運行之後,便得到上面那張圖。
你可以前往 https://github.com/linjiwx/mp 下載畫圖用的數據和完整代碼。
對於同一組數據,不同的人可能會有不同的觀察視角,對它們進行可視化,往往也存在多種不同的解決方案,這裡介紹的方法,並不是唯一正確的答案。關鍵在於,圖表的設計者想要表達什麼信息?是否讓觀眾正確且快速地理解瞭想要表達的信息?
不同類型的圖表,有著不同的優勢和劣勢。
斜率圖的優勢,是能快速看到每個類別前後發生的變化,並能根據線條的陡峭程度,直觀地感受到變化的幅度。
斜率圖的劣勢,是看不出整體與部分的占比關系。另外,如果類別的順序很重要,那麼也不適合使用斜率圖,因為類別會根據數值大小自動進行排列。
最後,留給你一道思考題:在你看到過的各種數據中,有哪些數據是適合用斜率圖進行對比分析的?
當你不知道該選擇什麼類型的圖表時,不妨停下來想一想,你希望讓觀眾瞭解什麼或者做什麼?
以上就是python 繪制斜率圖進行對比分析的詳細內容,更多關於python 對比分析的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- python繪制堆疊條形圖介紹
- Python利用matplotlib繪制圓環圖(環形圖)的實戰案例
- Python matplotlib的spines模塊實例詳解
- 利用Python matplotlib繪制風能玫瑰圖
- Python幾種繪制時間線圖的方法