Python數據可視化制作全球地震散點圖
前言:
為瞭制作全球地震散點圖,我在網上下載瞭一個數據集,其中記錄瞭一個月內全球發生的所有地震,但這些數據是以JSON格式存儲的,因此需要用json模塊來進行處理。
查看JSON數據
首先我們先打開下載好的數據集瀏覽一下:
你會發現其中的數據密密麻麻,根本不是人讀的,因此,接下來我們將對數據進行處理,讓它變得簡單易讀。
import json#導入json模塊,以便於加載文件中的數據 filename='eq_data_1_day_m1.json' with open(filename) as f: all_eq_data=json.load(f)#json.load(),將數據轉化為Python能夠處理的格式 readable_file='eq_data_1_day_m1.json'#創建一個文件,以便將這些數據以易於閱讀的方式寫入其中 with open(readable_file,'w') as f: json.dump(all_eq_data,f,indent=4)#json.dump()將數據讀入其中 #參數indent讓dump()使用與數據結構匹配的縮進量來設置數據的格式
經過處理之後,我們再打開這個文件會發現裡面的數據變得清晰瞭許多。
從中我們能夠快速獲取數據的很多信息,比如地震的次數,類型等等,不僅如此,我們還能夠知道有關這些數據的一些信息,比如,它的生成時間,他在網頁上怎麼獲取等等。
參數indent
如果indent是非負整數或字符串,則JSON數組元素和對象成員將使用該縮進級別進行打印。如果indent為0,負數或“”隻會插入換行符。
None(默認)則選擇最緊湊的表示形式。,使用正整數縮進會使每個級別縮進多個空格。,如果縮進是字符串(例如“
t”),則該字符串用於縮進每個級別。
當我們將縮進量修改為0時,文件的排版也會發生變化:
json.dump(all_eq_data,f,indent=0)
創建地震列表
import json filename='eq_data_1_day_m1.json' with open(filename) as f: all_eq_data=json.load(f)#對文件進行處理 all_eq_dicts=all_eq_data['features'] print(len(all_eq_dicts))#提取出這個文件記錄的所有地震
輸出結果如下:
158
是的,從文件的開頭,我們就可以確定地震的次數為158次,因此輸出結果正確:
提取震級
方法即是新建立一個列表用來存放震源的有關數據,再提取字典features的properties部分的mag.
代碼如下:
import json filename='eq_data_1_day_m1.json' with open(filename) as f: all_eq_data=json.load(f) all_eq_dicts=all_eq_data['features'] mags=[] for eq_dict in all_eq_dicts: mag=eq_dict['properties']['mag'] mags.append(mag) print(mags[:10])#打印前十次的震級數據
[0.96, 1.2, 4.3, 3.6, 2.1, 4, 1.06, 2.3, 4.9, 1.8]
提取位置數據
首先,我們需要在文件中找到關於經度和維度的部分,如下所示,我們在文件中查找到,它是存在於geometry字典下,coordinates鍵中的。
---snip--- all_eq_dicts=all_eq_data['features'] mags,titles,lons,lats=[],[],[],[] for eq_dict in all_eq_dicts: mag=eq_dict['properties']['mag'] title=eq_dict['properties']['title'] lon=eq_dict['geometry']['coordinates'][0]#提取coordinates鍵中索引值為0的數據 lat=eq_dict['geometry']['coordinates'][1] mags.append(mag) titles.append(title) lons.append(lon) lats.append(lat) print(mags[:10]) print(titles[:2]) print(lons[:5])#輸出前五個經度 print(lats[:5])#輸出前五個維度
輸出結果如下:
[0.96, 1.2, 4.3, 3.6, 2.1, 4, 1.06, 2.3, 4.9, 1.8]
['M 1.0 – 8km NE of Aguanga, CA', 'M 1.2 – 11km NNE of North Nenana, Alaska']
[-116.7941667, -148.9865, -74.2343, -161.6801, -118.5316667]
[33.4863333, 64.6673, -12.1025, 54.2232, 35.3098333]
繪制震級散點圖
通過我們前面提取的有關震源的數據,下面我們可對提取的數據進行可視化作圖:
import plotly.express as px#Plotly Express是Plotly的高級接口,相當於Matplotlib是一個工具 fig=px.scatter( x=lons, y=lats, labels={'x':'經度','y':'維度'}, range_x=[-200,200], range_y=[-90,90], #width和height代表圖表的高度和寬度均為800像素 width=800, height=800, title="全球地震散點圖", ) fig.write_html('global_earthquakes.html')#將可視化圖保存為html文件 fig.show()
散點圖配置完成後,下面我們在程序目錄下尋找我們保存的可視化圖(global_earthquakes.html),再使用瀏覽器打開該html文件
如下所示,即為散點圖:
指定圖表數據的方式
上面我們繪制地震散點圖是通過手動配置經緯度,通過將x,y和經度,緯度建立聯系:
x=lons, y=lats, labels={'x':'經度','y':'維度'},
但這在數據處理過程中並不是最簡單的方式,下面我們介紹另一種圖表指定數據的方式,需要結合我們上面所提到的pandas數據分析工具。
import pandas as pd#導入pandas模塊x data=pd.DataFrame(data=zip(lons,lats,titles,mags),colums=['經度','緯度','位置','震級'])#使用DataFrame將需要處理的數據封裝,註意:DataFrame後面的兩個參數是可選的,如果這兩個參數存在的話,這兩個參數的長度要和DataFrame的長度匹配 #zip()函數的作用:將可迭代的對象中的對應元素打包為多個元祖,再返回由這些元祖組成的列表 data.head()
DataFrame()函數
它是Python中pandas庫中的一種數據結構,和excel比較相似,它不僅可以設置列名columns和行名index,而且它的單元格可以存放數值,字符串等。
data.head():返回數據的前幾行數據,默認是前五行,如果需要指定則寫data.head(‘指定的行數’)
data.tail():返回data的後幾行數據,默認為後五行,如果需要指定則寫data.tail(‘指定的行數’)
數據封裝好之後,參數的配置方式可修改為:
data, x='經度', y='緯度',
現在我們通過這種參數配置方式進行地震散點圖的繪制:
#創建地震列表,提取數據 import json filename='eq_data_1_day_m1.json' with open(filename) as f: all_eq_data=json.load(f) all_eq_dicts=all_eq_data['features'] mags,titles,lons,lats=[],[],[],[] for eq_dict in all_eq_dicts: mag=eq_dict['properties']['mag'] title=eq_dict['properties']['title'] lon=eq_dict['geometry']['coordinates'][0]#提取coordinates鍵中索引值為0的數據 lat=eq_dict['geometry']['coordinates'][1] mags.append(mag) titles.append(title) lons.append(lon) lats.append(lat) #參數配置設置 import pandas as pd data=pd.DataFrame( data=zip(lons,lats,titles,mags),columns=['經度','緯度','位置','震級'] ) data.head() #繪制散點圖 import plotly.express as px fig = px.scatter( data, x='經度', y='緯度', range_x=[-200, 200], range_y=[-90, 90], width=800, height=800, title="全球地震散點圖", ) fig.write_html('global_earthquake.html') fig.show()
配置完成後,下面我們在程序目錄下尋找我們保存的可視化圖(global_earthquakes.html),再使用瀏覽器打開該html文件如下圖所示:
通過輸出結果,我們可得出,無論使用那種參數配置方式,其輸出結果都是相同的,但第二種這種以鍵值對的方式,更加清晰。
設計標記點的尺寸
和我們上篇文章提到的與溫度有關的散點圖相類似,我們希望知道最高溫度和最低溫度等這些特殊且重要的信息,那麼震源散點圖也是如此,上圖我們所設計的震源散點圖隻是將緯度和經度在圖上呈現出來瞭,但震源並沒有體現。
下面,我們將震級也呈現在散點圖上:
方法:使用size參數設計散點圖中每個尺寸的大小:
size='震級', size_max=10,
對比上面的兩幅圖,我們會發現散點圖中關於地震的信息還增加瞭震級,不僅如此,散點的尺寸大小也與震級的大小有關,震級越大,散點的尺寸越大,這樣一來,我們很容易觀察到不同地方的地震強度,但這還不夠直觀,為瞭能夠更加直白的呈現地震的情況,我們還設計散點的顏色以便更加清晰的顯示。
設計標記的顏色
方法:
color='震級', #默認漸變色的范圍是從藍到紅再到黃,數值越小標記越藍,而數值越大則標記越黃。
把在網上下載好的近30天的數據文件復制到該程序目錄下,將參數color添加其中,再繪制散點圖。,註意修改文件名。
如下圖所示:
美化後的散點圖,不僅在顏色上漂亮瞭許多,漸變的顏色也更加清晰的反映瞭地震的嚴重程度。
獲取Plotly Express中所有的漸變色:
不僅如此,Plotly Express還為我們提供瞭許多的漸變色,而這些漸變色是在px.colors.named_colorscales()中定義的,下面來獲取這些漸變色:
import plotly.express as px for key in px.colors.named_colorscales(): print(key,end='/')
輸出結果如下:
aggrnyl/agsunset/blackbody/bluered/blues/blugrn/bluyl/brwnyl/bugn/bupu/burg/burgyl/cividis
/darkmint/electric/emrld/gnbu/greens/greys/hot/inferno/jet/magenta/magma/mint/orrd/oranges
/oryel/peach/pinkyl/plasma/plotly3/pubu/pubugn/purd/purp/purples/purpor/rainbow/rdbu/rdpu
/redor/reds/sunset/sunsetdark/teal/tealgrn/turbo/viridis/ylgn/ylgnbu/ylorbr/ylorrd/algae
/amp/deep/dense/gray/haline/ice/matter/solar/speed/tempo/thermal/turbid/armyrose/brbg/earth
/fall/geyser/prgn/piyg/picnic/portland/puor/rdgy/rdylbu/rdylgn/spectral/tealrose/temps/tropic
/balance/curl/delta/oxy/edge/hsv/icefire/phase/twilight/mrybm/mygbm/
此外,我們還可將對應配色列表進行反轉:
方法:
px.colors.diverging.RdYlGn[::-1]
此外,Plotly除瞭有px.colors.diverging表示連續的配色方案,還有px.colors.sequential和px.colors.qualitative表示離散變量。每個漸變色都有起始色和終止色,有些漸變色還定義瞭一個或多個中間色。
添加鼠標指向時顯示的文本:
方法,使用參數hover_name,參數配置為data的‘位置’
hover_name='位置',
修改後,散點圖的輸出如下所示:
我們發現,對比於前面的圖表,此時又增加瞭位置信息,此時,我們就完整的繪制瞭一副關於地震信息的散點圖。
到此這篇關於Python數據可視化制作全球地震散點圖的文章就介紹到這瞭,更多相關Python地震散點圖內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 淺談哪個Python庫才最適合做數據可視化
- Python 如何保存json文件並格式化
- Python使用Plotly繪制常見5種動態交互式圖表
- Python 數據可視化實現5種炫酷的動態圖
- Python序列化模塊之pickle與json詳解