mysql幻讀詳解實例以及解決辦法

臟讀/不可重復讀的概念都比較容易理解和掌握,這裡不在討論

事務隔離級別(tx_isolation)

mysql 有四級事務隔離級別 每個級別都有字符或數字編號

級別 symbol 描述
讀未提交 READ-UNCOMMITTED 0 存在臟讀、不可重復讀、幻讀的問題
讀已提交 READ-COMMITTED 1 解決臟讀的問題,存在不可重復讀、幻讀的問題
可重復讀 REPEATABLE-READ 2 mysql 默認級別,解決臟讀、不可重復讀的問題,存在幻讀的問題。使用 MMVC機制 實現可重復讀
序列化 SERIALIZABLE 3 解決臟讀、不可重復讀、幻讀,可保證事務安全,但完全串行執行,性能最低

我們可以通過以下命令 查看/設置 全局/會話 的事務隔離級別

mysql> SELECT @@global.tx_isolation, @@tx_isolation;
+-----------------------+------------------+
| @@global.tx_isolation | @@tx_isolation   |
+-----------------------+------------------+
| REPEATABLE-READ       | READ-UNCOMMITTED |
+-----------------------+------------------+
1 row in set (0.00 sec)

# 設定全局的隔離級別 設定會話 global 替換為 session 即可 把set語法溫習一下
# SET [GLOABL] config_name = 'foobar';
# SET @@[session.|global.]config_name = 'foobar';
# SELECT @@[global.]config_name;

SET @@gloabl.tx_isolation = 0;
SET @@gloabl.tx_isolation = 'READ-UNCOMMITTED';

SET @@gloabl.tx_isolation = 1;
SET @@gloabl.tx_isolation = 'READ-COMMITTED';

SET @@gloabl.tx_isolation = 2;
SET @@gloabl.tx_isolation = 'REPEATABLE-READ';

SET @@gloabl.tx_isolation = 3;
SET @@gloabl.tx_isolation = 'SERIALIZABLE';

幻讀

首先我們要搞明白何謂幻讀,目前網上的眾多解釋幻讀的博文個人感覺仔細設想一下就能找出推翻的例子,就像博文把 非阻塞IO 等同為 異步IO,然後好多文章都紛紛借用,其實這倆貨是完全不同,非阻塞IO 是 同步IO 中的一種模式,並非 異步IO。錯誤的觀點都被大眾認同的 "正確化" 瞭,扯遠瞭,回歸主題。

幻讀會在 RU / RC / RR 級別下出現,SERIALIZABLE 則杜絕瞭 幻讀,但 RU / RC 下還會存在臟讀、不可重復讀,故我們就以 RR 級別來研究 幻讀,排除其他幹擾。

註意:RR 級別下存在幻讀的可能,但也是可以使用對記錄手動加 X鎖 的方法消除幻讀。SERIALIZABLE 正是對所有事務都加 X鎖 才杜絕瞭 幻讀,但很多場景下我們的業務 sql 並不會存在 幻讀 的風險。SERIALIZABLE 的一刀切雖然事務絕對安全,但性能會有很多不必要的損失。故可以在 RR 下根據業務需求決定是否加鎖,存在幻讀風險我們加鎖,不存在就不加鎖,事務安全與性能兼備,這也是 RR 作為 mysql 默認隔是個事務離級別的原因,所以需要正確的理解 幻讀。

幻讀錯誤的理解:說幻讀是 事務A 執行兩次 select 操作得到不同的數據集,即 select 1 得到 10 條記錄,select 2 得到 11 條記錄。這其實並不是幻讀,這是不可重復讀的一種,隻會在 R-U R-C 級別下出現,而在 mysql 默認的 RR 隔離級別是不會出現的。

這裡給出我對幻讀的比較白話的理解:

幻讀,並不是說兩次讀取獲取的結果集不同,幻讀側重的方面是某一次的 select 操作得到的結果所表征的數據狀態無法支撐後續的業務操作。更為具體一些:select 某記錄是否存在,不存在,準備插入此記錄,但執行 insert 時發現此記錄已存在,無法插入,此時就發生瞭幻讀。

這裡給出 mysql 幻讀的比較形象的場景(借用我在知乎上的回答):

table users: id primary key

事務T1

事務T2

step1 T1: SELECT * FROM \`users\` WHERE \`id\` = 1;
step2 T2: INSERT INTO \`users\` VALUES (1, 'big cat');
step3 T1: INSERT INTO \`users\` VALUES (1, 'big cat');
step4 T1: SELECT * FROM \`users\` WHERE \`id\` = 1;

T1 :主事務,檢測表中是否有 id 為 1 的記錄,沒有則插入,這是我們期望的正常業務邏輯。

T2 :幹擾事務,目的在於擾亂 T1 的正常的事務執行。

在 RR 隔離級別下,step1、step2 是會正常執行的,step3 則會報錯主鍵沖突,對於 T1 的業務來說是執行失敗的,這裡 T1 就是發生瞭幻讀,因為 T1 在 step1 中讀取的數據狀態並不能支撐後續的業務操作,T1:“見鬼瞭,我剛才讀到的結果應該可以支持我這樣操作才對啊,為什麼現在不可以”。T1 不敢相信的又執行瞭 step4,發現和 setp1 讀取的結果是一樣的(RR下的 MMVC機制)。此時,幻讀無疑已經發生,T1 無論讀取多少次,都查不到 id = 1 的記錄,但它的確無法插入這條他通過讀取來認定不存在的記錄(此數據已被T2插入),對於 T1 來說,它幻讀瞭。

其實 RR 也是可以避免幻讀的,通過對 select 操作手動加 行X鎖(SELECT … FOR UPDATE 這也正是 SERIALIZABLE 隔離級別下會隱式為你做的事情),同時還需要知道,即便當前記錄不存在,比如 id=1 是不存在的,當前事務也會獲得一把記錄鎖(因為InnoDB的行鎖鎖定的是索引,故記錄實體存在與否沒關系,存在就加 行X鎖,不存在就加 next-key lock間隙X鎖),其他事務則無法插入此索引的記錄,故杜絕瞭幻讀。

在 SERIALIZABLE 隔離級別下,step1 執行時是會隱式的添加 行(X)鎖 / gap(X)鎖的,從而 step2 會被阻塞,step3 會正常執行,待 T1 提交後,T2 才能繼續執行(主鍵沖突執行失敗),對於 T1 來說業務是正確的,成功的阻塞扼殺瞭擾亂業務的T2,對於T1來說他前期讀取的結果是可以支撐其後續業務的。

所以 mysql 的幻讀並非什麼讀取兩次返回結果集不同,而是事務在插入事先檢測不存在的記錄時,驚奇的發現這些數據已經存在瞭,之前的檢測讀獲取到的數據如同鬼影一般。

這裡要靈活的理解讀取的意思,第一次select是讀取,第二次的 insert 其實也屬於隱式的讀取,隻不過是在 mysql 的機制中讀取的,插入數據也是要先讀取一下有沒有主鍵沖突才能決定是否執行插入。

不可重復讀側重表達 讀-讀,幻讀則是說 讀-寫,用寫來證實讀的是鬼影。

RR級別下防止幻讀

RR級別下隻要對 SELECT 操作也手動加行(X)鎖即可類似 SERIALIZABLE 級別(它會對 SELECT 隱式加鎖),即大傢熟知的:

# 這裡需要用 X鎖, 用 LOCK IN SHARE MODE 拿到 S鎖 後我們沒辦法做 寫操作
SELECT `id` FROM `users` WHERE `id` = 1 FOR UPDATE;

如果 id = 1 的記錄存在則會被加行(X)鎖,如果不存在,則會加 next-lock key / gap 鎖(范圍行鎖),即記錄存在與否,mysql 都會對記錄應該對應的索引加鎖,其他事務是無法再獲得做操作的。

這裡我們就展示下 id = 1 的記錄不存在的場景,FOR UPDATE 也會對此 “記錄” 加鎖,要明白,InnoDB 的行鎖(gap鎖是范圍行鎖,一樣的)鎖定的是記錄所對應的索引,且聚簇索引同記錄是直接關系在一起的。

id = 1 的記錄不存在,開始執行事務:
step1: T1 查詢 id = 1 的記錄並對其加 X鎖
step2: T2 插入 id = 1 的記錄,被阻塞
step3: T1 插入 id = 1 的記錄,成功執行(T2 依然被阻塞中),T1 提交(T2 喚醒但主鍵沖突執行錯誤)

T1事務符合業務需求成功執行,T2幹擾T1失敗。

SERIALIZABLE級別杜絕幻讀

在此級別下,我們便不需要對 SELECT 操作顯式加鎖,InnoDB會自動加鎖,事務安全,但性能很低

step1: T1 查詢 id = 2 的記錄,InnoDB 會隱式的對齊加 X鎖
step2: T2 插入 id = 2 的記錄,被阻塞
step3: T1 插入 id = 2 的記錄,成功執行(T2 依然被阻塞中)
step4: T1 成功提交(T2 此時喚醒但主鍵沖突執行錯誤)

T1事務符合業務需求成功執行,T2幹擾T1失敗。

總結

RR 級別作為 mysql 事務默認隔離級別,是事務安全與性能的折中,可能也符合二八定律(20%的事務存在幻讀的可能,80%的事務沒有幻讀的風險),我們在正確認識幻讀後,便可以根據場景靈活的防止幻讀的發生。

SERIALIZABLE 級別則是悲觀的認為幻讀時刻都會發生,故會自動的隱式的對事務所需資源加排它鎖,其他事務訪問此資源會被阻塞等待,故事務是安全的,但需要認真考慮性能。

InnoDB 的行鎖鎖定的是索引,而不是記錄本身,這一點也需要有清晰的認識,故某索引相同的記錄都會被加鎖,會造成索引競爭,這就需要我們嚴格設計業務 sql,盡可能的使用主鍵或唯一索引對記錄加鎖。索引映射的記錄如果存在,加行鎖,如果不存在,則會加 next-key lock / gap 鎖 / 間隙鎖,故 InnoDB 可以實現事務對某記錄的預先占用,如果記錄存在,它就是本事務的,如果記錄不存在,那它也將是本是無的,隻要本是無還在,其他事務就別想占有它。

到此這篇關於mysql幻讀詳解的文章就介紹到這瞭,更多相關mysql幻讀詳解內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: