MySql主從復制機制全面解析

作為一個關系型數據庫,MySQL內建地提供數據復制機制,這使得在使用時,可以基於其復制機制實現高可用架構等高級特性,從而使得MySQL無需借助額外的插件或其他工具就具備適用於生產環境。這是MySQL得到大面積實際應用的條件之一。

基於MySQL的復制機制,不僅可以實現數據庫的高可用,還能實現如:性能擴展、異地災備以及冷熱分離等高級特性。

  • 高可用:通過配置一定的復制機制,MySQL實現瞭跨主機的數據復制,從而獲得一定的高可用能力,如果需要獲得更高的可用性,隻需要配置多個副本,或者進行級聯復制就可以達到目的。
  • 性能擴展:由於復制機制提供瞭多個數據備份,在讀寫一致性要求不高的場景下,可以通過配置一個或多個副本,將讀請求分發至副本節點,從而獲得整體上讀寫性能的提升。
  • 異地災備:隻需要將副本節點部署到異地機房,就可以輕松獲得一定的異地災備能力。實際當中,需要考慮網絡延遲等可能影響整體表現的因素。
  • 交易分離:通過配置復制機制,並將低頻、大運算量的交易發送至副本節點執行,就可以避免這些交易與高頻交易競爭運算資源,從而避免整體的性能問題。

為瞭獲得上述能力,需要瞭解基本的MySQL復制機制,並結合實際應用場景選擇恰當的配置。

主從復制機制

MySQL基於binlog實現主從復制,從節點跟蹤並獲取主節點binlog中最新更新並在自身進行重放,從而實現復制主節點數據。

下圖是MySQL主從復制過程的示意圖。在整個過程中涉及三個線程,他們的職責分別是:

  • 主節點binlog dump線程:該線程在從節點連接上主節點後創建,負責向從節點發送binlog中新寫入的數據。在讀取binlog時,dump線程會首先獲取binlog的鎖,並在讀取完畢後立刻釋放,然後將讀取到的數據發送至從節點。
  • 從節點I/O線程:從節點I/O線程職責為向主節點發送數據同步的請求,接收主節點發送的數據並將其寫入relay-log。
  • 從節點SQL線程:該線程從relay-log中讀取數據更新並進行重放。

異步復制

默認情況下,MySQL的主從復制是異步復制,在這種機制下,主節點會在完成本地日志寫入後立刻響應客戶端的請求,從節點的數據復制過程異步執行。

很明顯,在這種機制下面,由於復制過程並不會影響主節點對客戶端請求的響應,因此,相比於單節點,並不會造成整體性能上的明顯損失。

但是,在這種機制下面,如果數據在主節點完成提交而未同步至從節點時主節點宕機,此時如果發生主從切換並寫入新的數據,可能導致數據丟失或不一致。

半同步復制(semisynchronous replication)

從5.6版本開始,MySQL支持半同步復制,這種機制與異步復制相比主要有如下區別:

主節點在收到客戶端的請求後,必須在完成本節點日志寫入的同時,還需要等待至少一個從節點完成數據同步的響應之後(或超時),才會響應請求。

從節點隻有在寫入relay-log並完成刷盤之後,才會向主節點響應。

當從節點響應超時時,主節點會將同步機制退化為異步復制。在至少一個從節點恢復,並完成數據追趕後,主節點會將同步機制恢復為半同步復制。

可以看出,相比於異步復制,半同步復制在一定程度上提高瞭數據的可用性,在未退化至異步復制時,如果主節點宕機,此時數據已復制至至少一臺從節點。

同時,由於向客戶端響應時需要從節點完成響應,相比於異步復制,此時多出瞭主從節點上網絡交互的耗時以及從節點寫文件並刷盤的耗時,因此整體上集群對於客戶端的響應性能表現必然有所降低。

主從復制格式

由於MySQL的復制機制是基於binlog的,因此binlog的格式就決定瞭主從復制的格式。binlog有基於行的和基於語句兩種,從而復制也有兩種對應的格式。

Statement-Based Replication(SBR)

對於基於語句的復制機制,binlog僅記錄所執行的語句。這種方式,有如下優點:

  • 自從3.23版本就存在,經過長期驗證的成熟技術
  • 寫入日志文件的數據更少,這意味著更少的文件寫入和網絡傳輸消耗,從而整體上可以更快的完成主從復制,提升性能表現。
  • 日志文件記錄瞭所有數據庫上執行的語句,可以用來進行審計等用途

有如下缺點:

  • 用戶自定義函數(UDF)以及執行結果不確定的函數無法進行復制
  • 進行數據更新時,需要比基於行的復制更多的行鎖
  • 對於如先插入後更新式的復雜語句,從節點需要進行完全的對應重放,而基於行格式的復制隻需要執行最終結果即可

Row-Based Replication(RBR)

基於行的復制機制下,對應binlog也是基於行的,這時每次數據更新當寫入binlog時,都被轉化所有受影響行的變化。

這種復制方式,有如下優點:

  • 所有數據變化都可以被安全的復制,不會受到UDF以及特殊函數的影響。
  • 大部分DBMS都采用這種復制方式,知識遷移成本低。
  • 進行數據更新時,所需要的行鎖更少,從而可以獲取更高的性能表現。

有如下缺點:

  • 在涉及大數據量的DML時,基於行的日志將會產生大量的日志數據,大數據量在日志文件寫入、網絡傳輸方面都意味著更長的時間,從而可能導致整體性能表現顯著變差,同時也可能導致並發問題。
  • 無法通過日志查看所執行的語句,同時也無法獲知從節點上執行的語句。

在實際的架構應用中,需要根據系統的業務特點合理利用主從復制機制,並選擇合適主從復制格式。

以上就是MySql主從復制機制全面解析的詳細內容,更多關於MySql主從復制機制的資料請關註WalkonNet其它相關文章!