python庫JsonSchema驗證JSON數據結構使用詳解
JSON Schema是一個用於驗證JSON數據結構的強大工具, 我查看並學習瞭JSON Schema的官方文檔, 做瞭詳細的記錄, 分享一下。
我們可以使用JSON Schema在後續做接口測試中做詳細的數據值的校驗, 數據類型校驗, json數據結構的校驗。
jsonschema用以標註和驗證JSON文檔的元數據的文檔
官方文檔地址jsonschema
簡單實例
有一個簡單的json數據, 根據json數據格式編寫jsonschema, 然後校驗json數據每個字段是否是規定類型。
import jsonschema json_data = [ { 'pm10': 24, 'city': '珠海', 'time': '2016-10-23 13:00:00' }, { 'pm10': 24, 'city': '深圳', 'time': '2016-10-21 13:00:00' }, { 'pm10': '21', 'city': '廣州', 'time': '2016-10-23 13:00:00' } ] json_schema = { 'type': 'array', 'items': { 'type': 'object', 'properties': { 'pm10': { 'type': 'number', }, 'city': { 'type': 'string', 'enum': ['珠海', '深圳'] }, 'time': { 'type': 'string' } } } } try: jsonschema.validate(json_data, json_schema) except jsonschema.ValidationError as ex: msg = ex print(ex)
type關鍵字
type關鍵字是json模式的基礎, 指定架構的數據類型。JSON Schema的核心定義瞭以下基本類型:
- string
- Numeric types
- object
- array
- boolean
- null
這些類型在Python中對應的類型如下, 下表將JavaScript類型的名稱映射到Python的相關類型:
JavaScript | Python |
string | string |
number | int/float |
object | dict |
array | list |
boolean | bool |
null | none |
type關鍵字可以是一個字符串或數組:
- 如果它是一個字符串, 那麼它是上面一個基本能類型的名稱
- 如果它是一個數組, 它必須是一個字符串數組, 其中每個字符串是其中一個基本類型的名稱, 每個元素都是唯一的。在這種情況下, 如果json代碼段與任何給定類型匹配,則改代碼段有效。
以下做個type關鍵字的簡單示例:
{“type”: “number”}
定義某個字段類型是number, 如果是 40, 43.0這樣是校驗通過的如果是”43”, 包含數字的字符串這樣是無法校驗通過的.
{“type”: [“number”, ‘string’]}
定義某個字段類型是number或string中一種如果是43, 或者 “我和你” 這樣是校驗通過的如果是[43, “我和你”], 這樣是不通過的, 因為不接受結構化數據類型。
object關鍵字
在Python中, 對象對應的類型是dict類型。
屬性 properties
使用properties關鍵字定義對象上的屬性(鍵值對)。例如, 我們要為由數字, 街道名稱和街道類型組成的地址定義一個簡單的模式
{ “type” : “object” , “properties” : { “number” : { “type” : “number” }, “street_name” : { “type” : “string” }, “street_type” : { “type” : “string” , “enum” : [ “Street” , “Avenue” , “Boulevard” ] } } }
必需屬性
默認情況下,properties不需要由關鍵字定義的屬性。但是,可以使用required關鍵字提供所需屬性的列表。
required關鍵字接受一個或多個字符串的數組。每個字符串必須是唯一的。
在以下定義用戶記錄的示例模式中,我們要求每個用戶都有一個名稱和電子郵件地址,但我們不介意他們是否提供瞭他們的地址或電話號碼:
{ “type” : “object” , “properties” : { “name” : { “type” : “string” }, “email” : { “type” : “string” }, “address” : { “type” : “string” }, “telephone” : { “type” : “string” } }, “required” : [ “name” , “email”] }
大小
可以使用minProperties和maxProperties關鍵字限制對象上的屬性數 。這些中的每一個都必須是非負整數。
{ “type” : “object” , “minProperties” : 2 , “maxProperties” : 3 }
數組屬性
數組用於有序元素。
在Python中, array類似於 list或tuple類型,具體取決於用法。
例如: [1,2,3,4,5]
[2, ‘dd’]
items
數組的元素可能是任何東西, 但是,根據某些模式驗證數組的項通常很有用。這裡使用items和additionalItems關鍵字完成。
在JSON中, 通常使用兩種方式的數據
- 列表驗證: 任意長度的序列, 其中每個元素匹配相同的模式
- 元組驗證: 一個固定長度的序列,其中每個項目可能具有不同的模式, 在此用法中, 每個項目的索引(位置)對於如何解釋值是有意義的,例如Python的tuple。
List validation
列表驗證對於任意長度的數組非常有用, 其中每個項都匹配相同的模式, 對於此類數組, 將items關鍵字設置為單個模式, 用該模式來驗證數組中的所有項。
註意: 這時items是單個模式, additionalItems關鍵字沒有意義, 不應該使用它。
例如下面的事例中我們定義數組中每個項都是一個數字
{ “type” : “array” , "items": { "type": "number" } }
如果是[1,2,3,4,5], pass
如果是[1,2,3,’5’, 6] , false
如果是[], pass
Tuple validation
當數組是項目集合時, 就需要元組驗證。其中每個項目都有不同的模式, 並且每個項目的序數索引是有意義的。
例如: 街道地址這樣表示
1600 Pennsylvania Avenue NW就有4中type[number, streent_name, street_type, direction]
每個字段都有不同的架構
- number: 地址編號, 必須是數字
- street_name: 街道的名稱, 必須是字符串
- street_type: 街道的類型, 應該是一組固定值的字符串
- direction: 地址的位置, 應該是來自不同值集的字符串
為此我們將items關鍵字設置成一個數組, 其中每個項目都是一個與文檔數組的每個索引相對應的模式, 也就是一個數組, 第一個元素模式驗證輸入數組的第一個元素. 第二個元素模式驗證輸入數組的第二個元素, 等等
示例:
{ “type” : “array” , “items” : [ { “type” : “number” }, { “type” : “string” }, { “type” : “string” , “enum” : [ “Street” “ , ”Avenue“ , ”Boulevard“ ] }, { ”type“ : ”string“ , ”enum“ : [ ”NW“ , ”NE“ , “SW” , “SE” ] } ] }
如果是[1600, “賓夕法尼亞”, ‘Street’, “NW”], pass如果是[10,’等等’, ‘等等’], false並且在默認情況下, 添加其他項目也可以:[ 1600 , “賓夕法尼亞州” , “Street” , “NW” , “華盛頓” ]
additionalItems關鍵字控制是否有效有超出瞭在架構中定義的數組的其他項目,如果設置為false, 則會不允許數組中的額外項。
長度
可以使用minItems和 maxItems關鍵字指定數組的長度。每個關鍵字的值必須是非負數。無論是進行List驗證還是Tuple驗證,這些關鍵字都有效。示例:
{ “type” : “array” , “minItems” : 2 , “maxItems” : 3 }
唯一性
使用uniqueItems關鍵字設置為true, 則數組中的每個項都是唯一的。
通用關鍵字
元數據
json模式包含幾個關鍵字,title,description和default, 不嚴格用來校驗格式,但用來描述模式的一部分。在title和description管傢你必須是字符串
枚舉值
enum關鍵字用於限制值, 以一個固定的一組值, 它必須是一個必須包含一個元素的數組,其中每個元素都是唯一的。
{ ‘type’ : ‘string’, ‘enum’: [‘red’, ‘green’]}
如果檢驗字段的值在枚舉中是通過的, 如果不是無法校驗通過。
組合模式
JSON Schema包含一些用於將模式組合在一起的關鍵字,這並不意味著組合來自多個文件或JSON樹的模式, 盡管這些工具有助於實現這一點,並在結構化復雜模式中進行瞭描述。
例如, 在以下的模式, anyOf關鍵字用於表示給定值可能對任何給定的子模式有效。第一個子模式需要一個最大長度為5的字符串。第二個子模式需要一個最小值為0的數字。隻要一個值對這些模式中的任何一個進行驗證,它就被認為整個組合模式有效。
{ ‘anyOf’: [ {‘type’: ‘string’, ‘maxLength’: 5}, {‘type’:’string’, ‘minimum’: 0 }]}
用於組合模式的關鍵字是:
- allOf: 必須對所有子模式有效
- anyOf: 必須對任何子模式有效(一個或多個)
- oneOf: 必須僅對其中一個子模式有效
anyOf
要進行驗證anyOf,給定數據必須對任何(一個或多個)給定子模式有效。
{ “anyOf” : [ { “type” : “string” }, { “type” : “number” } ] }
如果是 “您好”, pass如果是 33, pass如果是 [‘ddd’, 33], false
oneOf
要進行驗證oneOf,給定數據必須僅對其中一個給定子模式有效。
{ “oneOf” : [ { “type” : “number” , “multipleOf” : 5 }, { “type” : “number” , “multipleOf” : 3 } ] }
如果是5的倍數, pass如果是3的倍數, pass如果是5和3的倍數, false
allOf
要進行驗證allOf,給定數據必須對所有給定的子模式有效。
{ “allOf” : [ { “type” : “string” }, { “maxLength” : 5 } ] }
$schema關鍵字
該$schema關鍵字用於聲明JSON片段實際上是JSON模式的一部分。它還聲明瞭針對該模式編寫的JSON Schema標準的哪個版本。
建議所有JSON模式都有一個$schema條目,該條目必須位於根目錄下。因此,大多數情況下,您需要在架構的根目錄下:
“$ schema” : “http://json-schema.org/schema#”
正則表達式
該模式和模式屬性關鍵字使用正則表達式來表示約束。使用的正則表達式語法來自JavaScript(具體為ECMA 262)。但是,並未廣泛支持該完整語法,因此建議您堅持使用下述語法的子集。
- 單個unicode字符(下面的特殊字符除外)與自身匹配。
- ^:僅匹配字符串的開頭。
- $:僅匹配字符串的末尾。
- (…):將一系列正則表達式分組到單個正則表達式中。
- |:匹配|符號前面或後面的正則表達式。
- [abc]:匹配方括號內的任何字符。
- [a-z]:匹配字符范圍。
- [^abc]:匹配未列出的任何字符。
- [^a-z]:匹配范圍之外的任何字符。
- +:匹配前一個正則表達式的一個或多個重復。
- *:匹配前面正則表達式的零次或多次重復。
- ?:匹配前一個正則表達式的零次或一次重復。
- +?,?,??:的,+和?預選賽都是貪婪的; 它們匹配盡可能多的文本。有時這種行為是不可取的,您希望匹配盡可能少的字符。
- {x}:完全x匹配前面正則表達式的出現次數。
- {x,y}:匹配前面正則表達式的至少x和最y多次出現。
- {x,}:匹配x前面正則表達式的出現次數或更多。
- {x}?,{x,y}?,{x,}?:上述表達式的惰性版本。
示例:
{ “type” : “string” , “pattern” : “^(\\([0-9] {3} \\))?[0-9]{3}-[0-9] {4} $ “ }
如果是 “555-1212”, pass如果是“(888)555-1212” , pass如果是“(888)555-1212分機532” , false
構建復雜的模式
重用
有些模式可能是在幾個地方都是通用的, 如果每次都重寫會使模式更加冗長,以後更新也會很復雜, 我們可以用重用的方式來做。例如:定義客戶記錄, 每個客戶都有可能同時擁有送貨地址和賬單地址, 地址總是相同的, 有街道地址, 城市, 州名。
定義地址模式:
{ “type” : “object” , “properties” : { “street_address” : { “type” : “string” }, “city” : { “type” : “string” }, “state” : { “type” : “string” } }, “required” : [ “street_address” , “city” ,“state” ] }
我們重用上面的模式, 將其放在父模式下, 名為definitions:
{ “definitions” : { “address” : { “type” : “object” , “properties” : { “street_address” :{“type” :“string”}, “city” : { “type” : “string” }, “state” : { “type” : “string” } }, “required” :[“street_address” ,“city”,“州”] } } }
然後我們使用$ref關鍵字從其他地方引用此架構片段, 指向此模塊的位置
{ “$ ref” : “#/ definitions / address” }
值 $ref 是一個名為 JSON Pointer的格式的字符串。
‘#’引用當前文檔,‘/’遍歷文檔中對象中的鍵, 因此
“#/ definitions / address” 意味著:
- 轉到文檔的根目錄
- 找到秘鑰的值”definitions”
- 在該對象中, 找到鍵的值”address”
$ref也可以是相對或絕對的URI, 例如:
{ “$ ref” : “definitions.json#/ address” }
以上就是python庫JsonSchema驗證JSON數據結構使用詳解的詳細內容,更多關於JsonSchema驗證JSON數據結構的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- 在.net項目使用JSONSchema示例詳解
- 使用Python解析JSON的實現示例
- JSON Schema概念及使用場景
- TypeScript 的條件類型使用示例詳解
- js前端表單數據處理表單數據校驗