MySQL Innodb關鍵特性之插入緩沖(insert buffer)

Posted on 2021-04-08 by WalkonNet

什麼是insert buffer？

插入緩沖，也稱之為insert buffer，它是innodb存儲引擎的關鍵特性之一，我們經常會理解插入緩沖時緩沖池的一個部分，這樣的理解是片面的，insert buffer的信息一部分在內存中，另外一部分像數據頁一樣，存在於物理頁中。

在innodb中，我們知道，如果一個表有自增主鍵，那麼對於這個表的默認插入是非常快的，註意，這裡的主鍵是自增的，如果不是自增的，那麼這個插入將會變成隨機的，就可能帶來數據頁分裂的開銷，這樣，插入就不是順序的，就會變慢。還有一種情況，就是如果我們插入的id不是順序的，而是隨機的，那麼即使有自增主鍵，那麼插入的速度也不會特別快。

如果我們定義瞭一個表，包含一個主鍵和一個非聚集索引，如下：

create table t(

a int auto_increment,

b varchar(30),

primary key(a),

key (b)

);

當我們按照主鍵a進行插入的時候，對於非聚集索引，也就是常說的二級索引b,它的插入不是順序的，插入性能必然會下降。

Innodb存儲引擎針對這種情況，設計瞭Insert Buffer，對於非聚集索引的插入或者更新操作，不是每一次插入到索引頁中，而是先判斷插入的非聚集索引頁是否在緩沖池中，如果在，則直接插入，如果不在，則先放入一個insert buffer中，告訴數據庫這個非聚集的索引已經插入到瞭葉子節點，實際上並沒有插入，隻是存放在另外一個位置，然後再以一定的頻率和情況進行Insert buffer和輔助索引葉子節點合並操作。這種時候，經常能將多條記錄的插入合並到一個操作中，這樣就大大提高瞭非聚集索引離散插入的性能。

insert buffer的觸發條件？

insert buffer需要滿足兩個條件才能被使用，第一，索引是輔助索引，也就是二級索引，第二，索引不是唯一的。當滿足上述兩個條件的時候，就可以使用insert buffer，從而提高數據庫的插入操作性能。

這裡需要註意，如果在程序進行瞭大量操作的時候發生瞭MySQL數據庫的宕機，那麼肯定有大量的insert buffer沒有合並到實際的非聚集索引中去，恢復可能會造成很長的時間。

為什麼不能是唯一索引？

之所以不支持唯一索引，是因為如果輔助索引是唯一索引，那麼在插入時需要校驗唯一性，校驗唯一性的時候就會發生離散讀取，從而又增加瞭開銷，那麼insert buffer得不償失。

我們可以通過show engine innodb status來查看insert buffer的使用情況，如下：

mysql--root@localhost:dms_alimetadata 20:35:24>>show engine innodb status\G
-------------------------------------
INSERT BUFFER AND ADAPTIVE HASH INDEX
-------------------------------------
Ibuf: size 1, free list len 0, seg size 2, 0 merges
merged operations:
 insert 0, delete mark 0, delete 0
discarded operations:
 insert 0, delete mark 0, delete 0

其中size代表瞭已經合並記錄頁的數量，free list len代表瞭空閑列表的長度，seg size顯示瞭當前insert buffer的大小為2*16KB

引入Change Buffer的概念

最新的MySQL5.7已經支持change buffer，事實上，它在innodb 1.0.x版本已經引入，這個change buffer 可以理解為insert buffer的升級，也就是對常見的DML語言都可以進行緩沖，包含insert delete以及update，對應的分別是insert buffer，delete buffer以及purge buffer。

當然，change buffer的使用對象仍然是非唯一的輔助索引。

這裡我們以update操作為例，update的過程可以拆分為兩個部分：

第一個部分是將記錄的delete_mask標記為刪除，如果你不瞭解delete_mask，可以在4月9號的文章中去看。第二個部分是真正的將記錄刪除。

而delete buffer對應的是update的第一個過程，purge buffer對應的是第二個部分。

在innodb中，我們可以通過參數innodb_change_buffering來開啟buffer的各種選項，該參數可選的值為inserts，deletes，purges，changes，all，none等，其中inserts，deletes和purges就是前面討論過的情況，changes表示開啟inserts和deletes，all表示開啟所有，默認的參數如下：

mysql--root@localhost:dms_alimetadata 21:13:37>>show variables like '%buffering%';        
+-------------------------+-------+
| Variable_name           | Value |
+-------------------------+-------+
| innodb_change_buffering | all   |
+-------------------------+-------+
1 row in set (0.01 sec)

我們還可以通過innodb_change_buffer_max_size來控制change_buffer的最大使用內存數量，該參數的默認值是25，也就是1/4，示例如下：

mysql--root@localhost:dms_alimetadata 21:20:52>>show variables like '%innodb_change_buffer_max_size%';
+-------------------------------+-------+
| Variable_name                 | Value |
+-------------------------------+-------+
| innodb_change_buffer_max_size | 25    |
+-------------------------------+-------+
1 row in set (0.00 sec)

在上面的show engine innodb status命令的輸出結果中，顯示瞭merged operation和discarded operation，其中insert 表示insert buffer的操作次數，delete mark表示delete buffer的操作次數，而delete表示purge buffer的操作次數，discarded operation表示當change buffer發生merge時，表已經被刪除，此時就無需進行合並。

Insert Buffer的實現？

insert buffer的數據結構是一棵B+樹，類似聚集索引一樣，全局隻有一棵insert buffer B+樹，它負責對所有的表進行insert buffer，而這棵B+樹放在共享表空間中，也就是ibdata1文件中，因此，試圖通過ibd文件恢復表數據的時候可能會出現check table失敗，原因是表的輔助索引中的數據可能還在insert buffer中，所以通過ibd文件恢復文件之後，還需要進行repair table操作來重建表上的輔助索引。

insert buffer既然是一棵樹，那麼必定有葉子節點和非葉子節點，非葉子節點存放的是查詢的search key值，它的構造如下：

+---------+------------+-------+
| space   |   marker   | Value |
+---------+------------+-------+

這個結構一共占用9個字節，其中，space表示待插入的記錄所在的表的表空間id，這個id是每個表都要有的唯一的id，其中space占用4個字節，marker占用1個字節，用來兼容老版本的insert buffer，offset占用4個字節，表示頁所在的偏移量。

輔助索引的插入過程？

當一個輔助索引要插入到數據頁的時候，如果這個數據頁不在緩沖池中，那麼innodb會根據規則構造一個search key，接下來將這個記錄插入到insert buffer的B+樹裡面去，插入的過程中，需要對這個記錄進行一些構造，最終插入的結果是類似下面這樣的一條記錄：

+---------+------------+-------+------------+------+-------+------+-------+
| space   |   marker   | Value | metadata   |      |       |      |       |
+---------+------------+-------+------------+------+-------+------+-------+

可以發現，最後面多瞭一個metadata的字段和4個其他的字段，先來說說metadata的字段，它占用4個字節，它用來排序每個記錄進入insert buffer的順序，從第5列開始，就是實際插入記錄的各個字段的值瞭，因此和單純的數據記錄相比，insert buffer需要額外13個字節的開銷。

為瞭保證每次merge insert buffer成功，需要設置一個特殊的數據頁來標記每個輔助索引頁的可用空間，這個數據頁的類型為insert buffer bitmap，這個頁可以追蹤很多輔助索引頁的可用空間。這裡簡單瞭解一下，下面會解釋它的用法。

Merged Insert Buffer的時機？

我們前面已經知道，當插入記錄的輔助索引頁不在緩沖池中的時候，需要將輔助索引記錄插入到這棵B+樹中，後續會從insert buffer中往真正的輔助索引中進行合並，那麼什麼時候進行合並呢？

1、輔助索引頁被讀取到緩沖池的時候

2、insert buffer Bitmap追蹤到該輔助索引頁已經沒有足夠的可用空間時，一般的閾值是輔助索引頁空間的1/32

3、master thread每秒執行一次merge insert buffer的操作

以上就是MySQL Innodb關鍵特性之插入緩沖(insert buffer)的詳細內容，更多關於Innodb特性之插入緩沖的資料請關註WalkonNet其它相關文章！

MySQL Innodb關鍵特性之插入緩沖(insert buffer)

什麼是insert buffer？

insert buffer的觸發條件？

為什麼不能是唯一索引？

引入Change Buffer的概念

Insert Buffer的實現？

輔助索引的插入過程？

Merged Insert Buffer的時機？

推薦閱讀：

發佈留言取消回覆

近期文章

什麼是insert buffer？

insert buffer的觸發條件？

為什麼不能是唯一索引？

引入Change Buffer的概念

Insert Buffer的實現？

輔助索引的插入過程？

Merged Insert Buffer的時機？

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆