python 繪制斜率圖進行對比分析

你好,我是林驥。

斜率圖,可以快速展現兩組數據之間各維度的變化,特別適合用於對比兩個時間點的數據。

比如說,為瞭對比分析某產品不同功能的用戶滿意度,經過問卷調查和數據統計,得到下面這個調查結果:

你不妨自己先思考一下,如何對這組數據進行可視化,才能讓信息傳遞變得更加高效?

下面是我用 matplotlib 制作的圖表:

從圖中可以直觀地看出,功能 C 的用戶滿意度明顯下降,我們用比較鮮明的橙色來表示,以便引起觀眾重點關註;功能 D 和功能 E 的用戶滿意度明顯提升,我們用藍色表示,代表數據正在向好的方向發展;功能 A 和功能 B 的用戶滿意度變化不大,我們用淺灰色表示,以便削弱觀眾對這兩個功能的註意力,把更多的精力用於分析用戶滿意度明顯下降的功能點,從而讓圖表起到提升信息傳遞效率的目的。

下面是用 matplotlib 畫圖的詳細步驟。

首先,導入所需的庫,並設置中文字體和定義顏色等。

# 導入所需的庫
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import matplotlib.image as image

# 正常顯示中文標簽
mpl.rcParams['font.sans-serif'] = ['SimHei']

# 自動適應佈局
mpl.rcParams.update({'figure.autolayout': True})

# 正常顯示負號
mpl.rcParams['axes.unicode_minus'] = False

# 定義顏色,主色:藍色,輔助色:灰色,互補色:橙色
c = {'藍色':'#00589F', '深藍色':'#003867', '淺藍色':'#5D9BCF',
   '灰色':'#999999', '深灰色':'#666666', '淺灰色':'#CCCCCC',
   '橙色':'#F68F00', '深橙色':'#A05D00', '淺橙色':'#FBC171'}

其次,從 Excel 文件中讀取隨機模擬的數據,並定義畫圖用的數據。

# 數據源路徑
filepath='./data/問卷調查結果.xlsx'

# 讀取 Excel文件
df = pd.read_excel(filepath, index_col='調查年度')

# 定義畫圖用的數據
category_names = df.columns
labels = df.index
data = df.values
data_cum = data.cumsum(axis=1)

接下來,開始用「面向對象」的方法進行畫圖。

# 使用「面向對象」的方法畫圖,定義圖片的大小
fig, ax=plt.subplots(figsize=(6, 6))

# 設置背景顏色
fig.set_facecolor('w')
ax.set_facecolor('w')

# 設置標題
ax.set_title('\n用戶滿意度隨時間的變化\n', fontsize=26, loc='left', color=c['深灰色'])

# 定義顏色
category_colors = [c['淺灰色'], c['淺灰色'], c['橙色'], c['藍色'], c['藍色']]

# 畫斜率圖
for i, color in zip(np.arange(len(df.columns)), category_colors):
  ax.plot(df.index, df.iloc[:, i], marker='o', color=color)

  # 設置數據標簽及其文字顏色
  ax.text(-0.03, df.iloc[0, i], df.columns[i] + ' ' + '{:.0%}'.format(df.iloc[0, i]), ha='right', va='center', color=color, fontsize=16)
  ax.text(1.06, df.iloc[1, i], '{:.0%}'.format(df.iloc[1, i]), ha='left', va='center', color=color, fontsize=16)

# 設置 Y 軸刻度范圍
ax.set_ylim(df.values.min()-0.02, df.values.max()+0.01)

# 隱藏 Y 軸
ax.yaxis.set_visible(False)

# 隱藏邊框
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
ax.spines['left'].set_visible(False)
ax.spines['bottom'].set_visible(False)

# 隱藏 X 軸的刻度線
ax.tick_params(axis='x', which='major', length=0)

# 設置坐標標簽字體大小和顏色
ax.tick_params(labelsize=16, colors=c['灰色'])

plt.show()

運行之後,便得到上面那張圖。

你可以前往 https://github.com/linjiwx/mp 下載畫圖用的數據和完整代碼。

對於同一組數據,不同的人可能會有不同的觀察視角,對它們進行可視化,往往也存在多種不同的解決方案,這裡介紹的方法,並不是唯一正確的答案。關鍵在於,圖表的設計者想要表達什麼信息?是否讓觀眾正確且快速地理解瞭想要表達的信息?

不同類型的圖表,有著不同的優勢和劣勢。

斜率圖的優勢,是能快速看到每個類別前後發生的變化,並能根據線條的陡峭程度,直觀地感受到變化的幅度。

斜率圖的劣勢,是看不出整體與部分的占比關系。另外,如果類別的順序很重要,那麼也不適合使用斜率圖,因為類別會根據數值大小自動進行排列。

最後,留給你一道思考題:在你看到過的各種數據中,有哪些數據是適合用斜率圖進行對比分析的?

當你不知道該選擇什麼類型的圖表時,不妨停下來想一想,你希望讓觀眾瞭解什麼或者做什麼?

以上就是python 繪制斜率圖進行對比分析的詳細內容,更多關於python 對比分析的資料請關註WalkonNet其它相關文章!

推薦閱讀: