詳解MySQL中事務隔離級別的實現原理

前言

說到數據庫事務,大傢腦子裡一定很容易蹦出一堆事務的相關知識,如事務的ACID特性,隔離級別,解決的問題(臟讀,不可重復讀,幻讀)等等,但是可能很少有人真正的清楚事務的這些特性又是怎麼實現的,為什麼要有四個隔離級別。

今天我們就先來聊聊MySQL中事務的隔離性的實現原理,後續還會繼續出文章分析其他特性的實現原理。

當然MySQL博大精深,文章疏漏之處在所難免,歡迎批評指正。

說明

MySQL的事務實現邏輯是位於引擎層的,並且不是所有的引擎都支持事務的,下面的說明都是以InnoDB引擎為基準。

定義

隔離性(isolation)指的是不同事務先後提交並執行後,最終呈現出來的效果是串行的,也就是說,對於事務來說,它在執行過程中,感知到的數據變化應該隻有自己操作引起的,不存在其他事務引發的數據變化。

隔離性解決的是並發事務出現的問題。

標準SQL隔離級別

隔離性最簡單的實現方式就是各個事務都串行執行瞭,如果前面的事務還沒有執行完畢,後面的事務就都等待。但是這樣的實現方式很明顯並發效率不高,並不適合在實際環境中使用。

為瞭解決上述問題,實現不同程度的並發控制,SQL的標準制定者提出瞭不同的隔離級別:未提交讀(read uncommitted)、提交讀(read committed)、可重復讀(repeatable read)、序列化讀(serializable)。其中最高級隔離級別就是序列化讀,而在其他隔離級別中,由於事務是並發執行的,所以或多或少允許出現一些問題。見以下的矩陣表:

隔離級別(+:允許出現,-:不允許出現) 臟讀 不可重復讀 幻讀
未提交讀                                  +         +               +        
提交讀                                    –         +               +        
可重復讀                                  –         –               +        
序列化讀                                  –         –               –        

註意,MySQL的InnoDB引擎在提交讀級別通過MVCC解決瞭不可重復讀的問題,在可重復讀級別通過間隙鎖解決瞭幻讀問題,具體見下面的分析。

實現原理

標準SQL事務隔離級別實現原理

我們上面遇到的問題其實就是並發事務下的控制問題,解決並發事務的最常見方式就是悲觀並發控制瞭(也就是數據庫中的鎖)。標準SQL事務隔離級別的實現是依賴鎖的,我們來看下具體是怎麼實現的:

事務隔離級別    實現方式                                                     
未提交讀(RU) 事務對當前被讀取的數據不加鎖;

事務在更新某數據的瞬間(就是發生更新的瞬間),必須先對其加行級共享鎖,直到事務結束才釋放。

提交讀(RC)    事務對當前被讀取的數據加行級共享鎖(當讀到時才加鎖),一旦讀完該行,立即釋放該行級共享鎖;

事務在更新某數據的瞬間(就是發生更新的瞬間),必須先對其加行級排他鎖,直到事務結束才釋放。

可重復讀(RR) 事務在讀取某數據的瞬間(就是開始讀取的瞬間),必須先對其加行級共享鎖,直到事務結束才釋放;

事務在更新某數據的瞬間(就是發生更新的瞬間),必須先對其加行級排他鎖,直到事務結束才釋放。

序列化讀(S)   事務在讀取數據時,必須先對其加表級共享鎖 ,直到事務結束才釋放;

事務在更新數據時,必須先對其加表級排他鎖 ,直到事務結束才釋放。

可以看到,在隻使用鎖來實現隔離級別的控制的時候,需要頻繁的加鎖解鎖,而且很容易發生讀寫的沖突(例如在RC級別下,事務A更新瞭數據行1,事務B則在事務A提交前讀取數據行1都要等待事務A提交並釋放鎖)。

為瞭不加鎖解決讀寫沖突的問題,MySQL引入瞭MVCC機制,詳細可見我以前的分析文章:一文讀懂數據庫中的樂觀鎖和悲觀鎖和MVCC。

InnoDB事務隔離級別實現原理

在往下分析之前,我們有幾個概念需要先瞭解下:

1、鎖定讀和一致性非鎖定讀

鎖定讀:在一個事務中,主動給讀加鎖,如SELECT … LOCK IN SHARE MODE 和 SELECT … FOR UPDATE。分別加上瞭行共享鎖和行排他鎖。鎖的分類可見我以前的分析文章:你應該瞭解的MySQL鎖分類)。

https://dev.mysql.com/doc/refman/8.0/en/innodb-locking-reads.html

一致性非鎖定讀:InnoDB使用MVCC向事務的查詢提供某個時間點的數據庫快照。查詢會看到在該時間點之前提交的事務所做的更改,而不會看到稍後或未提交的事務所做的更改(本事務除外)。也就是說在開始瞭事務之後,事務看到的數據就都是事務開啟那一刻的數據瞭,其他事務的後續修改不會在本次事務中可見。

Consistent read是InnoDB在RC和RR隔離級別處理SELECT語句的默認模式。一致性非鎖定讀不會對其訪問的表設置任何鎖,因此,在對表執行一致性非鎖定讀的同時,其它事務可以同時並發的讀取或者修改它們。

https://dev.mysql.com/doc/refman/8.0/en/innodb-consistent-read.html

2、當前讀和快照讀

當前讀

讀取的是最新版本,像UPDATE、DELETE、INSERT、SELECT …  LOCK IN SHARE MODE、SELECT … FOR UPDATE這些操作都是一種當前讀,為什麼叫當前讀?就是它讀取的是記錄的最新版本,讀取時還要保證其他並發事務不能修改當前記錄,會對讀取的記錄進行加鎖。

快照讀

讀取的是快照版本,也就是歷史版本,像不加鎖的SELECT操作就是快照讀,即不加鎖的非阻塞讀;快照讀的前提是隔離級別不是未提交讀和序列化讀級別,因為未提交讀總是讀取最新的數據行,而不是符合當前事務版本的數據行,而序列化讀則會對表加鎖。

3、隱式鎖定和顯式鎖定

隱式鎖定

InnoDB在事務執行過程中,使用兩階段鎖協議(不主動進行顯示鎖定的情況):

  • 隨時都可以執行鎖定,InnoDB會根據隔離級別在需要的時候自動加鎖;
  • 鎖隻有在執行commit或者rollback的時候才會釋放,並且所有的鎖都是在同一時刻被釋放。

顯式鎖定

  • InnoDB也支持通過特定的語句進行顯示鎖定(存儲引擎層)
select ... lock in share mode //共享鎖
select ... for update //排他鎖
  • MySQL Server層的顯示鎖定:
lock table
unlock table

瞭解完上面的概念後,我們來看下InnoDB的事務具體是怎麼實現的(下面的讀都指的是非主動加鎖的select)

事務隔離級別    實現方式                                                     
未提交讀(RU) 事務對當前被讀取的數據不加鎖,都是當前讀;

事務在更新某數據的瞬間(就是發生更新的瞬間),必須先對其加行級共享鎖,直到事務結束才釋放。

提交讀(RC)    事務對當前被讀取的數據不加鎖,且是快照讀;

事務在更新某數據的瞬間(就是發生更新的瞬間),必須先對其加行級排他鎖(Record),直到事務結束才釋放。

通過快照,在這個級別MySQL就解決瞭不可重復讀的問題

可重復讀(RR) 事務對當前被讀取的數據不加鎖,且是快照讀;

事務在更新某數據的瞬間(就是發生更新的瞬間),必須先對其加行級排他鎖(Record,GAP,Next-Key),直到事務結束才釋放。

通過間隙鎖,在這個級別MySQL就解決瞭幻讀的問題

序列化讀(S)   事務在讀取數據時,必須先對其加表級共享鎖 ,直到事務結束才釋放,都是當前讀;

事務在更新數據時,必須先對其加表級排他鎖 ,直到事務結束才釋放。

可以看到,InnoDB通過MVCC很好的解決瞭讀寫沖突的問題,而且提前一個級別就解決瞭標準級別下會出現的幻讀和不可重復讀問題,大大提升瞭數據庫的並發能力。

一些常見誤區

幻讀到底包不包括瞭delete的情況?

不可重復讀:前後多次讀取一行,數據內容不一致,針對其他事務的update和delete操作。為瞭解決這個問題,使用行共享鎖,鎖定到事務結束(也就是RR級別,當然MySQL使用MVCC在RC級別就解決瞭這個問題)

幻讀:當同一個查詢在不同時間生成不同的行集合時就是出現瞭幻讀,針對的是其他事務的insert操作,為瞭解決這個問題,鎖定整個表到事務結束(也就是S級別,當然MySQL使用間隙鎖在RR級別就解決瞭這個問題)

網上很多文章提到幻讀和提交讀的時候,有的說幻讀包括瞭delete的情況,有的說delete應該屬於提交讀的問題,那到底真相如何呢?我們實際來看下MySQL的官方文檔(如下)

The so-called phantom problem occurs within a transaction when the same query produces different sets of rows at different times. For example, if a SELECT) is executed twice, but returns a row the second time that was not returned the first time, the row is a “phantom” row.
https://dev.mysql.com/doc/refman/5.7/en/innodb-next-key-locking.html

可以看到,幻讀針對的是結果集前後發生變化,所以看起來delete的情況應該歸為幻讀,但是我們實際分析下上面列出的標準SQL在RR級別的實現原理就知道,標準SQL的RR級別是會對查到的數據行加行共享鎖,所以這時候其他事務想刪除這些數據行其實是做不到的,所以在RR下,不會出現因delete而出現幻讀現象,也就是幻讀不包含delete的情況。

MVCC能解決瞭幻讀問題?

網上很多文章會說MVCC或者MVCC+間隙鎖解決瞭幻讀問題,實際上MVCC並不能解決幻讀問題。如以下的例子:

begin;

#假設users表為空,下面查出來的數據為空

select * from users; #沒有加鎖

#此時另一個事務提交瞭,且插入瞭一條id=1的數據

select * from users; #讀快照,查出來的數據為空

update users set name='mysql' where id=1;#update是當前讀,所以更新成功,並生成一個更新的快照

select * from users; #讀快照,查出來id為1的一條記錄,因為MVCC可以查到當前事務生成的快照

commit;

可以看到前後查出來的數據行不一致,發生瞭幻讀。所以說隻有MVCC是不能解決幻讀問題的,解決幻讀問題靠的是間隙鎖。如下:

begin;

#假設users表為空,下面查出來的數據為空

select * from users lock in share mode; #加上共享鎖

#此時另一個事務B想提交且插入瞭一條id=1的數據,由於有間隙鎖,所以要等待

select * from users; #讀快照,查出來的數據為空

update users set name='mysql' where id=1;#update是當前讀,由於不存在數據,不進行更新

select * from users; #讀快照,查出來的數據為空

commit;

#事務B提交成功並插入數據

註意,RR級別下想解決幻讀問題,需要我們顯式加鎖,不然查詢的時候還是不會加鎖的

以上就是詳解MySQL中事務隔離級別的實現原理的詳細內容,更多關於MySQL 事務隔離級別的資料請關註WalkonNet其它相關文章!

推薦閱讀: