Python解析JSON對象的全過程記錄

前言

本章節我們將為大傢介紹如何使用 Python 語言來編碼和解碼 JSON 對象。

json處理模塊的主要任務,是將一個JSON對象,轉換成Python數據類型數據進行處理,或者反之,將Python數據類型數據,轉換成JSON對象(字符串流),在不同的模塊或者系統間傳輸。

1. JSON數據格式特點

  1. 對象表示為鍵值對
  2. 數據由逗號分隔
  3. 花括號保存對象
  4. 方括號保存數組
{
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"裡斯" , "age":17 }
 ]
}
{'students': [{'name': '北山啦', 'age': 20},
 {'name': '張三', 'age': 30},
 {'name': '裡斯', 'age': 17}]}

上面就是一個JSON格式數據。它開起來就像是在Python中的字典數據類型。我們可以通過json模塊將它轉換成字符串或者反過來將字符串轉換成字典數據類型。

JSON也支持各種數據類型,它的數據類型和Python各種數據類型之間的對比如下:

  • object —— dict
  • array —— list
  • string —— str
  • number —— int/float
  • true/false —— True/False
  • null —— None

2. 常用方法總結

在json模塊中,用於處理json的主要是四個函數,分別是:

  • loads():從JSON字符串中讀取數據並轉換成Python數據類型
  • load():從JSON文件中讀取數據並轉換成Python數據類型
  • dumps():將Python數據類型數據轉換成JSON字符串
  • dump():將Python數據類型數據轉換成JSON字符串寫入到文件

3. 系列化和反系列化

從JSON數據轉換到Python數據,叫反系列化(deserialization)

從Python數據轉換到JSON數據,叫系列化(serialization)

3.1 系列化

系列化:將Python數據轉換成JSON字符串的方法。

下面我們先來看一個簡單的例子。

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"裡斯" , "age":17 }
 ]
}
print(type(data))
print(data)
json_str = json.dumps(data)
print(type(json_str))
<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '張三', 'age': 30}, {'name': '裡斯', 'age': 17}]}
<class 'str'>

上面的例子中,雖然看起來數據沒有發生變化,但其實它們的數據類型已經發生瞭本質的改變:將字典數據類型的data,轉換成瞭str類型,然後我們就可以將這個str類型的數據轉換成流,在網絡上進行傳輸或者寫入到文件等。

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"裡斯" , "age":17 }
 ]
}

print(type(data))
print(data)
json_str = json.dumps(data, separators=('>>','::'), indent=2)
print(json_str)
<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '張三', 'age': 30}, {'name': '裡斯', 'age': 17}]}
{
 "students"::[
 {
 "name"::"\u5317\u5c71\u5566">>
 "age"::20
 }>>
 {
 "name"::"\u5f20\u4e09">>
 "age"::30
 }>>
 {
 "name"::"\u91cc\u65af">>
 "age"::17
 }
 ]
}

將data寫入txt文件中

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"張三" , "age":30 },
 { "name":"裡斯" , "age":17 }
 ]
}
with open("students.txt","w") as fp:
 json.dump(data, fp, ensure_ascii=False)
 print("finish")

finish

這樣就將data寫入瞭students.txt,看看是不是已經將數據寫進去瞭。

3.2 反系列化

從JSON數據轉換到Python類型數據,叫反系列化。可以通過loads()/load()這兩個方法來完成。

import json
with open("students.txt") as fp:
 data = json.load(fp)
 """取出字典key為students的數據,
 得到一個list,再從這個list中取第一個數據"""
 print(data['students'][0]) 

{‘name’: ‘北山啦’, ‘age’: 20}

parse_int參數

默認值為None,如果指定瞭parse_int,用來對JSON int字符串進行解碼,這可以用於為JSON整數使用另一種數據類型或解析器。

parse_int參數,這裡我們簡單將其指定為float類型。

import json
with open("students.txt") as fp:
 data = json.load(fp, parse_int = float)
 print(data)

{‘students’: [{‘name’: ‘北山啦’, ‘age’: 20.0}, {‘name’: ‘張三’, ‘age’: 30.0}, {‘name’: ‘裡斯’, ‘age’: 17.0}]}

可以看到,age原來是整數類型,通過parse_int已經被轉換成瞭float類型。

object_hook

默認值為None,object_hook是一個可選函數,此功能可用於實現自定義解碼器。指定一個函數,該函數負責把反序列化後的基本類型對象轉換成自定義類型的對象。

def fromJSON(dct): # 這裡會對所有的字典數據類型都進行遍歷
 if isinstance(dct, dict) and 'students' in dct:
 return dct['students']
 else:
 return Student(dct['name'], dct['age'])

import json

with open("students.txt") as fp:
 data = json.load(fp, object_hook=fromJSON)
 print(data)


[姓名: 北山啦, 年齡: 20, 姓名: 張三, 年齡: 30, 姓名: 裡斯, 年齡: 17]

總結

到此這篇關於Python解析JSON對象的文章就介紹到這瞭,更多相關Python解析JSON對象內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!