MySQL之高可用架構詳解

引言

“高可用”是互聯網一個永恒的話題,先避開MySQL不談,為瞭保證各種服務的高可用有幾種常用的解決方案。

服務冗餘:把服務部署多份,當某個節點不可用時,切換到其他節點。服務冗餘對於無狀態的服務是相對容易的。

服務備份:有些服務是無法同時存在多個運行時的,比如說:Nginx的反向代理,一些集群的leader節點。這時可以存在一個備份服務,處於隨時待命狀態。

自動切換:服務冗餘之後,當某個節點不可用時,要做到快速切換。

總結起來就是 冗餘+故障轉移 。

MySQL高可用

MySQL的高可用也是同樣的思路,首先要有多個MySQL實例提供服務,其次就是當某個實例掛掉時,可以自動切換流量。同時MySQL作為存儲,節點之間數據同步也是一個難題(換句話說,有狀態的服務都面臨這個問題)。

一主一備:

MySQL的各種高可用架構,都脫離不瞭MySQL實例之間的數據同步,因此,我們先介紹下最簡單的一主一備架構下MySQL的數據同步流程。

老生常談:MySQL高可用架構

上圖是主從數據同步的一個示意圖。

Master節點有Dump進程把binlog中的數據發送到Slave節點,

Slave節點有IO進程接收數據寫入relay log,

Slave節點的SQL進程根據relay log寫入數據。

這裡還要延伸一點,binlog存在三種形式:Statement、Row、Mixed。

Statement:就是把每一條SQL記錄到binlog中。

Row:是把每一行修改的具體數據記錄到binlog中。

Mixed:MySQL會靈活的區分,需要記錄sql還是具體修改的記錄。

隻記錄SQL的話binlog會比較小,但是有些SQL語句在主從同步數據的時候,可能會因為選擇不同的索引在數據同步過程中出現數據不一致。記錄Row的話就可以保證主從同步不會存在SQL語意偏差的問題,同時Row類型的日志在做數據恢復的時候也比較容易,但是Row會導致binlog過大。

MySQL主從同步的幾種模式:

異步模式:
在這種同步策略下,主庫按照自己的流程處理完數據,會直接返回結果,不會等待主庫和從庫之間的數據同步。 優點:效率高。 缺點:Master節點掛掉之後,Slave節點會丟失數據。全同步模式: 主庫會等待所有從庫都執行完sql語句並ACK完成,才返回成功。 優點:有很好的數據一致性保障。 缺點:會造成數據操作延遲,降低瞭MySQL的吞吐量。半同步模式:主庫會等待至少有一個從庫把數據寫入relay log並ACK完成,才成功返回結果。 半同步模式介於異步和全同步之間。

半同步的復制方案是在MySQL5.5開始引入的,普通的半同步復制方案步驟如下圖:

Master節點寫數據到Binlog,並且執行Sync操作。Master發送數據給Slave節點,同時commit主庫的事務。收到ACK後Master節點把數據返回給客戶端。

這種數據提交模式叫: after_commit

老生常談:MySQL高可用架構

after_commit 模式存在問題: 主庫等待ACK時,事務已經commit,主庫的其他事務可以讀到commit的數據,這個時候如果Master崩潰,slave數據丟失,發生主從切換,會導致出現幻讀。 為瞭解決這個問題MySQL5.7提出瞭新的半同步復制模式: after_sync

老生常談:MySQL高可用架構

把主庫的事務提交放到瞭ACK之後,避免瞭上述問題。 MySQL5.7還引入瞭 enhanced multi-threaded slave (簡稱MTS)模式, 當slave配置 slave_parallel_workers >0並且
global.slave_parallel_type =‘LOGICAL_CLOCK’,可支持一個schema下,slave_parallel_workers個worker線程並發執行relay log中主庫提交的事務,極大地提高瞭主從復制的效率。 MySQL5.7半同步功能可以通過
rpl_semi_sync_master_wait_slave_count 參數配置slave節點ACK的個數,認為主從同步完成。

基於MySQL主從同步數據越來越完善,效率越來越高,也就引出瞭第一種MySQL的高可用架構: 基於MySQL自身的主從同步方案,常用的一種部署架構是: 用戶通過VIP訪問Master和Slave節點,每個節點采用keepalved探索。配置主從關系,進行數據同步。

老生常談:MySQL高可用架構

基於MHA的高可用架構: 部署一份MHA的Manager節點,在MySQL各個實例部署MHA Node節點。MHA可以實現秒級的故障自動轉移。 當然MySQL節點之間的數據同步還要依賴MySQL自身的數據同步方式。

老生常談:MySQL高可用架構

MGR(MySQL Group Replication)模式: 感覺MySQL官方更看好MGR集群方案,但是目前我還不知道國內有哪一傢公司在使用。 MGR集群是由所有的MySQL Server共同組成的,每個Server都有完整的副本數據,副本之間基於Row格式的日志和GTID來做副本之前的數據同步,采用Paxos算法實現數據的一致性保障。 MGR架構要比前面講述的半同步和異步同步數據的方式要復雜,具體可以參照 官網

老生常談:MySQL高可用架構

總結

MySQL的高可用架構沒有銀彈,瞭解其原理,選擇符合自己業務場景的部署架構就可以瞭。

到此這篇關於MySQL之高可用架構詳解的文章就介紹到這瞭,更多相關MySQL高可用架構內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: