Python應用之利用pyecharts畫中國地圖

這段時間在爬取瞭杭州某網站發佈的二手房信息,在作圖的時候發現在地圖呈現上還是有欠缺,這裡就把用到的貼出來,提升一下記憶。

之前有接觸用Basemap繪制地圖,但是在涉及到中國行政劃分上感覺不是很方便。Echarts在數據可視化上應用比較廣泛,這裡采用pyecharts生成echarts風格的圖表。

環境:pycharm;python3.6;

1、安裝

pycharts包的安裝

pip install pyecharts

在繪制地圖時,需要導入相應的地圖文件包

  • 全球國傢地圖: echarts-countries-pypkg (1.9MB)
  • 中國省級地圖: echarts-china-provinces-pypkg (730KB)
  • 中國市級地圖: echarts-china-cities-pypkg (3.8MB)

建議繪圖之前就裝好,安裝方法跟安裝工具包的方法一致:

pip install echarts-countries-pypkg;
pip install echarts-china-provinces-pypkg
pip install echarts-china-cities-pypkg

2、繪制地圖

from pyecharts import Map

# attr, value要顯示的數值
value = [20, 100]
attr = ['餘杭區', '蕭山區']

# 圖框的基本特性
m = Map('杭州地圖示例圖', width=600, height=400)

# 添加數據到圖框中
m.add('', attr, value, maptype=u'杭州', visual_range=[0, 100], is_visualmap=True, visual_text_color='#000')

# show_config() 打印輸出圖表的所有配置項
m.show_config()

# render() 生成 .html 文件
m.render()

m = Map( title=”“, subtitle=”“, **kwargs) 指定圖框基本特性。

m.add(**kwargs)主要用於數據呈現,依次為圖例、x, y。

  • attr: list, 是地級市名的列表,你要對哪個區域進行標註,就寫入對應的區域。註意裡面的名字要規整,不然後面就標記不成功。
  • value:list, 是attr各區對應的數值。
  • maptype=u’杭州’:指定需要繪制的地區的區域。可以是省級地名,也可以是市級地名。
  • visual_range=[0,100]:指定地圖的顏色范圍區間,默認是[0,100]。這裡主要是參考y值的范圍,便於生成有顏色差的圖形。
  • is_label_show=True :顯示每個點的值x

m.show_config(): 會在終端打印出圖表文件的所有配置項。

m.render():默認在當前文件生成一個render.html 文件

通過瀏覽器打開生成的render.html文件即可看到生成的圖形

pyecharts的坑—“畫圖不顯示“

關於Pyecharts畫圖,圖卻不顯示出來的問題,出問題可能有好幾種原因。可能是版本問題、包沒下全等等,在這邊說的是一個很坑的問題,博主因為這個白白浪費瞭好幾個小時和精力。

最近在做數據挖掘課設,用pandas處理數據,十分的方便,沒錯,圖不顯示就是因為它。

下面為大傢舉個例子

假設我們有一組數據,轉為DataFrame或者Series後經過多種處理,最終從中提取出來,想要用pyecharts做一個圖,於是就會出現文章標題這樣的錯誤。

from pyecharts.charts import Bar
from pyecharts import options as opts
import pandas as pd

x = [16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
y = [3, 8, 7, 18, 28, 48, 59, 44, 61, 80, 69, 59, 63, 59, 64, 46, 64, 55, 50, 62, 57, 51, 44, 34, 34, 34, 40, 34, 39, 41, 22, 43, 30, 23]
pdx = pd.Series(x)
pdy = pd.Series(y)
x_value = pdx.values
y_value = pdy.values
# Pyecharts 1.9.0所以支持鏈式表達
bar = (
    Bar()
    .add_xaxis(x_value)
    .add_yaxis("y值", y_value)
    .set_global_opts(title_opts=opts.TitleOpts(title="標題"))
)
bar.render()

讓我們來看看這樣畫出來的圖,就會發現它顯示不出來。

原因如下

print(x_value)
print(type(y_value))
print(type(y_value[0]))

打印出來之後就會發現:

[16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
 40 41 42 43 44 45 46 47 48 49]
<class 'numpy.ndarray'>
<class 'numpy.int64'>

列表中的數據類型為numpy.int64

而pyecharts要求int類型的數據,所以畫的柱狀圖無法顯示數據。

正確的做法就是把數據全部轉為int類型,或者不用pandas處理數據…

我嘗試著在轉為datafram、或series時將類型轉為int,但它還是會自動轉為numpy.int32。

pdx = pd.Series(x, dtype=int)
pdy = pd.Series(y, dtype=int)

print類型

<class 'numpy.ndarray'>
<class 'numpy.int32'>

不過知道原因之後就好解決瞭。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: