MySQL Innodb關鍵特性之插入緩沖(insert buffer)

什麼是insert buffer?

   插入緩沖,也稱之為insert buffer,它是innodb存儲引擎的關鍵特性之一,我們經常會理解插入緩沖時緩沖池的一個部分,這樣的理解是片面的,insert buffer的信息一部分在內存中,另外一部分像數據頁一樣,存在於物理頁中。

    在innodb中,我們知道,如果一個表有自增主鍵,那麼對於這個表的默認插入是非常快的,註意,這裡的主鍵是自增的,如果不是自增的,那麼這個插入將會變成隨機的,就可能帶來數據頁分裂的開銷,這樣,插入就不是順序的,就會變慢。還有一種情況,就是如果我們插入的id不是順序的,而是隨機的,那麼即使有自增主鍵,那麼插入的速度也不會特別快。

    如果我們定義瞭一個表,包含一個主鍵和一個非聚集索引,如下:

create table t(

a int auto_increment,

b varchar(30),

primary key(a),

key (b)

);

當我們按照主鍵a進行插入的時候,對於非聚集索引,也就是常說的二級索引b,它的插入不是順序的,插入性能必然會下降。

  Innodb存儲引擎針對這種情況,設計瞭Insert Buffer,對於非聚集索引的插入或者更新操作,不是每一次插入到索引頁中,而是先判斷插入的非聚集索引頁是否在緩沖池中,如果在,則直接插入,如果不在,則先放入一個insert buffer中,告訴數據庫這個非聚集的索引已經插入到瞭葉子節點,實際上並沒有插入,隻是存放在另外一個位置,然後再以一定的頻率和情況進行Insert buffer和輔助索引葉子節點合並操作。這種時候,經常能將多條記錄的插入合並到一個操作中,這樣就大大提高瞭非聚集索引離散插入的性能。

insert buffer的觸發條件?

    insert buffer需要滿足兩個條件才能被使用,第一,索引是輔助索引,也就是二級索引,第二,索引不是唯一的。當滿足上述兩個條件的時候,就可以使用insert buffer,從而提高數據庫的插入操作性能。

    這裡需要註意,如果在程序進行瞭大量操作的時候發生瞭MySQL數據庫的宕機,那麼肯定有大量的insert buffer沒有合並到實際的非聚集索引中去,恢復可能會造成很長的時間。

為什麼不能是唯一索引?

    之所以不支持唯一索引,是因為如果輔助索引是唯一索引,那麼在插入時需要校驗唯一性,校驗唯一性的時候就會發生離散讀取,從而又增加瞭開銷,那麼insert buffer得不償失。

    我們可以通過show engine innodb status來查看insert buffer的使用情況,如下:

mysql--root@localhost:dms_alimetadata 20:35:24>>show engine innodb status\G
-------------------------------------
INSERT BUFFER AND ADAPTIVE HASH INDEX
-------------------------------------
Ibuf: size 1, free list len 0, seg size 2, 0 merges
merged operations:
 insert 0, delete mark 0, delete 0
discarded operations:
 insert 0, delete mark 0, delete 0

  其中size代表瞭已經合並記錄頁的數量,free list len代表瞭空閑列表的長度,seg size顯示瞭當前insert buffer的大小為2*16KB

引入Change Buffer的概念

    最新的MySQL5.7已經支持change buffer,事實上,它在innodb 1.0.x版本已經引入,這個change buffer 可以理解為insert buffer的升級,也就是對常見的DML語言都可以進行緩沖,包含insert delete以及update,對應的分別是insert buffer,delete buffer以及purge buffer。

   當然,change buffer的使用對象仍然是非唯一的輔助索引。

    這裡我們以update操作為例,update的過程可以拆分為兩個部分:

第一個部分是將記錄的delete_mask標記為刪除,如果你不瞭解delete_mask,可以在4月9號的文章中去看。第二個部分是真正的將記錄刪除。

而delete buffer對應的是update的第一個過程,purge buffer對應的是第二個部分。

    在innodb中,我們可以通過參數innodb_change_buffering來開啟buffer的各種選項,該參數可選的值為inserts,deletes,purges,changes,all,none等,其中inserts,deletes和purges就是前面討論過的情況,changes表示開啟inserts和deletes,all表示開啟所有,默認的參數如下:

mysql--root@localhost:dms_alimetadata 21:13:37>>show variables like '%buffering%';        
+-------------------------+-------+
| Variable_name           | Value |
+-------------------------+-------+
| innodb_change_buffering | all   |
+-------------------------+-------+
1 row in set (0.01 sec)

我們還可以通過innodb_change_buffer_max_size來控制change_buffer的最大使用內存數量,該參數的默認值是25,也就是1/4,示例如下:

mysql--root@localhost:dms_alimetadata 21:20:52>>show variables like '%innodb_change_buffer_max_size%';
+-------------------------------+-------+
| Variable_name                 | Value |
+-------------------------------+-------+
| innodb_change_buffer_max_size | 25    |
+-------------------------------+-------+
1 row in set (0.00 sec)

    在上面的show engine innodb status命令的輸出結果中,顯示瞭merged operation和discarded operation,其中insert 表示insert buffer的操作次數,delete mark表示delete buffer的操作次數,而delete表示purge buffer的操作次數,discarded operation表示當change buffer發生merge時,表已經被刪除,此時就無需進行合並。

Insert Buffer的實現?

   insert buffer的數據結構是一棵B+樹,類似聚集索引一樣,全局隻有一棵insert buffer B+樹,它負責對所有的表進行insert buffer,而這棵B+樹放在共享表空間中,也就是ibdata1文件中,因此,試圖通過ibd文件恢復表數據的時候可能會出現check table失敗,原因是表的輔助索引中的數據可能還在insert buffer中,所以通過ibd文件恢復文件之後,還需要進行repair table操作來重建表上的輔助索引。

   insert buffer既然是一棵樹,那麼必定有葉子節點和非葉子節點,非葉子節點存放的是查詢的search key值,它的構造如下:

+---------+------------+-------+
| space   |   marker   | Value |
+---------+------------+-------+

這個結構一共占用9個字節,其中,space表示待插入的記錄所在的表的表空間id,這個id是每個表都要有的唯一的id,其中space占用4個字節,marker占用1個字節,用來兼容老版本的insert buffer,offset占用4個字節,表示頁所在的偏移量。

輔助索引的插入過程?

    當一個輔助索引要插入到數據頁的時候,如果這個數據頁不在緩沖池中,那麼innodb會根據規則構造一個search key,接下來將這個記錄插入到insert buffer的B+樹裡面去,插入的過程中,需要對這個記錄進行一些構造,最終插入的結果是類似下面這樣的一條記錄:

+---------+------------+-------+------------+------+-------+------+-------+
| space   |   marker   | Value | metadata   |      |       |      |       |
+---------+------------+-------+------------+------+-------+------+-------+

可以發現,最後面多瞭一個metadata的字段和4個其他的字段,先來說說metadata的字段,它占用4個字節,它用來排序每個記錄進入insert buffer的順序,從第5列開始,就是實際插入記錄的各個字段的值瞭,因此和單純的數據記錄相比,insert buffer需要額外13個字節的開銷。

   為瞭保證每次merge insert buffer成功,需要設置一個特殊的數據頁來標記每個輔助索引頁的可用空間,這個數據頁的類型為insert buffer bitmap,這個頁可以追蹤很多輔助索引頁的可用空間。這裡簡單瞭解一下,下面會解釋它的用法。

Merged Insert Buffer的時機?

   我們前面已經知道,當插入記錄的輔助索引頁不在緩沖池中的時候,需要將輔助索引記錄插入到這棵B+樹中,後續會從insert buffer中往真正的輔助索引中進行合並,那麼什麼時候進行合並呢?

1、輔助索引頁被讀取到緩沖池的時候

2、insert buffer Bitmap追蹤到該輔助索引頁已經沒有足夠的可用空間時,一般的閾值是輔助索引頁空間的1/32

3、master thread每秒執行一次merge insert buffer的操作

以上就是MySQL Innodb關鍵特性之插入緩沖(insert buffer)的詳細內容,更多關於Innodb特性之插入緩沖的資料請關註WalkonNet其它相關文章!

推薦閱讀:

    None Found