提高MySQL深分頁查詢效率的三種方案
開發經常遇到分頁查詢的需求,但是當翻頁過多的時候,就會產生深分頁,導致查詢效率急劇下降。有沒有什麼辦法,能解決深分頁的問題呢?本文總結瞭三種優化方案,查詢效率直接提升10倍,一起學習一下。
開發經常遇到分頁查詢的需求,但是當翻頁過多的時候,就會產生深分頁,導致查詢效率急劇下降。
有沒有什麼辦法,能解決深分頁的問題呢?
本文總結瞭三種優化方案,查詢效率直接提升10倍,一起學習一下。
1. 準備數據
先創建一張用戶表,隻在create_time字段上加索引:
CREATE TABLE `user` ( `id` int NOT NULL AUTO_INCREMENT COMMENT '主鍵', `name` varchar(255) DEFAULT NULL COMMENT '姓名', `create_time` timestamp NULL DEFAULT NULL COMMENT '創建時間', PRIMARY KEY (`id`), KEY `idx_create_time` (`create_time`) ) ENGINE=InnoDB COMMENT='用戶表';
然後往用戶表中插入100萬條測試數據,這裡可以使用存儲過程:
drop PROCEDURE IF EXISTS insertData; DELIMITER $$ create procedure insertData() begin declare i int default 1; while i <= 100000 do INSERT into user (name,create_time) VALUES (CONCAT("name",i), now()); set i = i + 1; end while; end $$ call insertData() $$
2. 驗證深分頁問題
每頁10條,當我們查詢第一頁的時候,速度很快:
select * from user where create_time>'2022-07-03' limit 0,10;
在不到0.01秒內直接返回瞭,所以沒顯示出執行時間。
當我們翻到第10000頁的時候,查詢效率急劇下降:
select * from user where create_time>'2022-07-03' limit 100000,10;
執行時間變成瞭0.16秒,性能至少下降瞭幾十倍。
耗時主要花在哪裡瞭?
- 需要掃描前10條數據,數據量較大,比較耗時
- create_time是非聚簇索引,需要先查詢出主鍵ID,再回表查詢,通過主鍵ID查詢出所有字段
畫一下回表查詢流程:
1. 先通過create_time查詢出主鍵ID
2. 再通過主鍵ID查詢出表中所有字段
別問為什麼B+樹的結構是這樣的?問就是規定。
可以看一下前兩篇文章。
然後我們就針對這兩個耗時原因進行優化。
3. 優化查詢
3.1 使用子查詢
先用子查詢查出符合條件的主鍵,再用主鍵ID做條件查出所有字段。
select * from user where id in ( select id from user where create_time>'2022-07-03' limit 100000,10 );
不過這樣查詢會報錯,說是子查詢中不支持使用limit。
我們加一層子查詢嵌套,就可以瞭:
select * from user where id in ( select id from ( select id from user where create_time>'2022-07-03' limit 100000,10 ) as t );
執行時間縮短到0.05秒,減少瞭0.12秒,相當於查詢性能提升瞭3倍。
為什麼先用子查詢查出符合條件的主鍵ID,就能縮短查詢時間呢?
我們用explain查看一下執行計劃就明白瞭:
explain select * from user where id in ( select id from ( select id from user where create_time>'2022-07-03' limit 100000,10 ) as t );
可以看到Extra列顯示子查詢中用到Using index,表示用到瞭覆蓋索引,所以子查詢無需回表查詢,加快瞭查詢效率。
3.2 使用inner join關聯查詢
把子查詢的結果當成一張臨時表,然後和原表進行關聯查詢。
select * from user inner join ( select id from user where create_time>'2022-07-03' limit 100000,10 ) as t on user.id=t.id;
查詢性能跟使用子查詢一樣。
3.3 使用分頁遊標(推薦)
實現方式就是:當我們查詢第二頁的時候,把第一頁的查詢結果放到第二頁的查詢條件中。
例如:首先查詢第一頁
select * from user where create_time>'2022-07-03' limit 10;
然後查詢第二頁,把第一頁的查詢結果放到第二頁查詢條件中:
select * from user where create_time>'2022-07-03' and id>10 limit 10;
這樣相當於每次都是查詢第一頁,也就不存在深分頁的問題瞭,推薦使用。
執行耗時是0秒,查詢性能直接提升瞭幾十倍。
這樣的查詢方式雖然好用,但是又帶來一個問題,就是跳轉到指定頁數,隻能一頁頁向下翻。
所以這種查詢隻適合特定場景,比如資訊類APP的首頁。
互聯網APP一般采用瀑佈流的形式,比如百度首頁、頭條首頁,都是一直向下滑動翻頁,並沒有跳轉到制定頁數的需求。
不信的話,可以看一下,這是頭條的瀑佈流:
傳參中帶瞭上一頁的查詢結果。
響應數據中,返回瞭下一頁查詢條件。
所以這種查詢方式的應用場景還是挺廣的,趕快用起來吧。
知識點總結:
到此這篇關於解決MySQL深分頁低效率問題的文章就介紹到這瞭。希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。
推薦閱讀:
- MySql統計函數COUNT的具體使用詳解
- Mysql循環插入數據的實現
- Mysql調優Explain工具詳解及實戰演練(推薦)
- MySQL常見優化方案匯總
- MySQL之select、distinct、limit的使用