MySQL為JSON字段創建索引方式(Multi-Valued Indexes 多值索引)

多值索引簡介

MySQL 8.0.17 開始, InnoDB支持創建多值索引(Multi-Valued Indexes),該索引是在JSON存儲值數組的列上定義的二級索引,對於單個數據記錄可以有多個索引記錄。此類索引特定的語法定義:

CAST(expression AS type ARRAY),例如CAST(data->'$.zipcode' AS UNSIGNED ARRAY)。 跟普通索引一樣,也可以在EXPLAIN中查看到。

創建多值索引

跟其他索引一樣,多值索引可以在建表時添加,也可以通過ALTER TABLE或者CREATE INDEX創建。

JSON對象字段索引

語法

ALTER TABLE customers ADD INDEX idx_mv_custinfo_list( ( CAST( custinfo -> '$.key' AS UNSIGNED array ) ) );

註意:這裡在CAST語法外面有兩層單括號!,如果少寫一個會報錯!

測試案例

PS:文中的案例是參考官方文檔中的案例,隻是作為測試,所以在命名等方面並不怎麼規范,實際開發過程中要嚴格遵守公司團隊的開發規范,不要偷懶!

DROP TABLE IF EXISTS `customers`;
/*建表語句*/
CREATE TABLE customers ( 
	id BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY, 
	modified DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, 
	custinfo JSON NOT NULL 
);
/*插入寫測試數據*/
INSERT INTO customers
VALUES
	( NULL, NOW(), '{"key":94582,"value":"asdf"}' ),
	( NULL, NOW(), '{"key":94568,"value":"gjgasdasdf"}' ),
	( NULL, NOW(), '{"key":94477,"value":"ghasdfsdf"}' ),
	( NULL, NOW(), '{"key":94536,"value":"hagsdfgdf"}' ),
	( NULL, NOW(), '{"key":94507,"value":"wasfgjdf"}' );
/*添加多值索引*/
ALTER TABLE customers ADD INDEX idx_mv_custinfo_list( ( CAST( custinfo -> '$.key' AS UNSIGNED array)) );
/*測試 MEMBER OF 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	94507 MEMBER OF ( custinfo -> '$.key' );
/*測試 JSON_CONTAINS 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	JSON_CONTAINS(
		custinfo -> '$.key',
	CAST( '[94582]' AS JSON ));
/*測試 JSON_OVERLAPS 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	JSON_OVERLAPS (
		custinfo -> '$.key',
	CAST( '[94477]' AS JSON ));

查看執行計劃發現可以使用到索引:

如果需要給字符類型創建多值索引,則必須是utf8mb4字符集且排序規則是utf8mb4_0900_as_cs,否則報錯該版本不支持: 

如果要為binary二進制字符串創建多值索引的話,則排序規則必須是binary,否則報錯不支持。

修改排序規則後可成功添加索引:

JSON數組對象索引

語法

ALTER TABLE customers ADD INDEX idx_mv_custinfo_list( ( CAST( custinfo -> '$[*].key' AS UNSIGNED array ) ) );

註意:這裡在CAST語法外面有兩層單括號!如果少寫一個會報錯!

測試案例

DROP TABLE IF EXISTS `customers`;
/*建表語句*/
CREATE TABLE customers ( 
	id BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY, 
	modified DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, 
	custinfo JSON NOT NULL 
);
/*插入寫測試數據*/
INSERT INTO customers
VALUES
	( NULL, NOW(), '[{"key":94582},{"key":94536}]'),
	( NULL, NOW(), '[{"key":94568},{"key":94507},{"key":94582}]'),
	( NULL, NOW(), '[{"key":94477},{"key":94507}]'),
	( NULL, NOW(), '[{"key":94536}]'),
	( NULL, NOW(), '[{"key":94507},{"key":94582}]');
/*添加多值索引*/
ALTER TABLE customers ADD INDEX idx_mv_custinfo_list( ( CAST( custinfo -> '$[*].key' AS UNSIGNED array)) );
/*測試 MEMBER OF 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	94507 MEMBER OF ( custinfo -> '$[*].key' );
/*測試 JSON_CONTAINS 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	JSON_CONTAINS(
		custinfo -> '$[*].key',
	CAST( '[94582, 94507]' AS JSON ));
/*測試 JSON_OVERLAPS 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	JSON_OVERLAPS (
		custinfo -> '$[*].key',
	CAST( '[94477, 94582]' AS JSON ));

查看執行計劃發現可以使用到索引:

在組合索引中創建多值索引

語法

語法跟普通組合索引差不多,同樣也遵守最左匹配原則:

ALTER TABLE customers ADD INDEX idx_age_custinfo$list_modified
( age, (CAST( custinfo -> '$[*].key' AS UNSIGNED ARRAY )), modified );

註意:這裡在CAST語法外面需要使用小括號括起來!

測試案例

DROP TABLE IF EXISTS `customers`;
/*建表語句*/
CREATE TABLE customers ( 
	id BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY, 
	age tinyint(4) not null,
	modified DATETIME DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, 
	custinfo JSON NOT NULL 
);
/*插入寫測試數據*/
INSERT INTO customers
VALUES
	( NULL, 21, NOW(), '[{"key":94582},{"key":94536}]'),
	( NULL, 22, NOW(), '[{"key":94568},{"key":94507},{"key":94582}]'),
	( NULL, 23, NOW(), '[{"key":94477},{"key":94507}]'),
	( NULL, 24, NOW(), '[{"key":94536}]'),
	( NULL, 25, NOW(), '[{"key":94507},{"key":94582}]');
/*添加多值索引*/
alter table customers DROP INDEX idx_age_custinfo$list_modified ;
ALTER TABLE customers ADD INDEX idx_age_custinfo$list_modified ( age, (CAST( custinfo -> '$[*].key' AS UNSIGNED ARRAY )),modified );
ALTER TABLE customers ADD INDEX idx_age_custinfo$list_modified ((CAST( custinfo -> '$[*].key' AS UNSIGNED ARRAY )), age,modified  );
ALTER TABLE customers ADD INDEX idx_age_custinfo$list_modified ( age,modified, (CAST( custinfo -> '$[*].key' AS UNSIGNED ARRAY )) );
/*測試 MEMBER OF 語法*/
SELECT
	* 
FROM
	customers 
WHERE
	94536 MEMBER OF ( custinfo -> '$[*].key' ) and modified = '2021-08-05 10:36:34' and age = 21;

查看執行計劃發現可以使用到索引:

多值索引的局限

  • 一個多值索引隻允許包含一個屬性的值
  • 該索引目前隻支持三個語法

目前隻有MEMBER OF、 JSON_CONTAINS()、 JSON_OVERLAB()三種語法可以使用到多值索引。

  • 索引值必須轉成數組

( CAST( custinfo -> '$.key' AS UNSIGNED array)),語法中的array是可以不加的,之所以要強制加是因為如果不加就不是數組結構,不是數組結構就沒法直接使用上述三個語法,需要通過JSON_ARRAY()等方法轉換後才能使用,這樣就會導致索引失效!因此不管需要加索引的字段是單個值的字段還是數組字段,都要加上array關鍵字。

  • 該索引不支持用於表關聯
  • 不能結合前綴索引
  • 不支持在線創建多值索引

這句話的意思是該操作使用 ALGORITHM=COPY,即通過新建一張表結構,再將數據復制過去的方式實現索引的創建。因此該過程中不允許DML操作。

  • 多值索引對字符集類型字段有明確的要求

binary字符集的排序規則必須是binary

utf8mb4字符集的排序規則必須是utf8mb4_0900_as_cs

其他任何字符集或排序規則都不能創建多值索引,創建時會報錯當前版本不支持。

應用場景

多值索引的應用場景非常廣泛!有瞭他之後很多關聯關系表都可以不用瞭!舉個簡單的例子:用戶標簽,很多場景下會給用戶貼上各種標簽,比如1高 2富 3帥,為瞭後續的更高效的做統計或篩選查詢,我們不能直接將這個標簽作為一個字段存儲,因為沒有索引查詢效率不高,所以很多時候會使用一張關聯關系表來存儲用戶-標簽的關系。但是現在有瞭多值索引,我們就可以將標簽作為一個字段存儲瞭!

這隻是其中一個小場景,類似的場景非常多,用戶可以換成任何事物,標簽也可以換成其他任何屬性,隻要是這個事物存在多種屬性值就行,存在一個多對多關系,那麼在沒有需要這個屬性與其他表做表關聯的請況下),都可以使用多值索引實現!多值索引不支持表關聯,因此如果需要用該字段在做表關聯的話就不合適瞭。

關於JSON函數,還有其他的文章介紹:

  • Mysql json類型字段Java+Mybatis數據字典功能實踐
  • MySQL JSON類型字段使用技巧

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。 

推薦閱讀: