PostgreSQL 數據庫跨版本升級常用方案解析

upgrade

大傢好,我是隻談技術不剪發的 Tony 老師。對於企業而言,將數據庫系統升級到新版本通常可以獲得更好的性能、更多的功能、最新的安全補丁和錯誤修復等。因此,本文就來介紹一下 PostgreSQL 數據庫版本升級的 3 種常用方案。

升級方案概述

PostgreSQL 版本號由主要版本和次要版本組成。例如,PostgreSQL 12.4 中的 12 是主要版本,4 是次要版本;PostgreSQL 10.0 之前的版本由 3 個數字組成,例如 9.6.19,其中 9.6 是主要版本,19 是次要版本。

發佈次要版本是不會改變內存的存儲格式,因此總是和相同的主要版本兼容。例如,PostgreSQL 12.4 和 PostgreSQL 12.0 以及後續的 PostgreSQL 12.x 兼容。對於這些兼容版本的升級非常簡單,隻需要關閉數據庫服務,安裝替換二進制的可執行文件,重新啟動服務即可。

接下來,我們主要討論 PostgreSQL 的跨版本升級問題,例如從 PostgreSQL 12.x 升級到 PostgreSQL 13.y。主要版本的升級可能會修改內部數據的存儲格式,因此需要執行額外的操作。常用的跨版本升級方法和適用場景如下:

升級方法 適用場景 停機時間
邏輯備份與還原 中小型數據庫,例如小於 100 GB
支持跨平臺數據遷移
取決於數據庫的大小
pg_upgrade 工具 大中型數據庫,例如大於 100 GB
本機就地升級
幾分鐘
邏輯復制 大中型數據庫,例如大於 100 GB
跨平臺支持
幾秒鐘

 是的

📝如果使用廠商提供的 PostgreSQL 定制版本,也可能通過他們提供的工具實現版本升級,具體參考相關文檔。

註意事項:升級主要版本通過會導致用戶可見的不兼容性,因此應用程序可能需要進行相應的修改。具體的變化可以參考發行說明,尤其是“Migration”部分的內容;如果跨多個主要版本進行升級,需要閱讀每個中間版本的發行說明。

通過邏輯備份與還原進行升級

傳統的跨版本升級方法利用 pg_dump/pg_dumpall 邏輯備份導出數據庫,然後在新版本中通過 pg_restore 進行還原。導出舊版本數據庫時推薦使用新版本的 pg_dump/pg_dumpall 工具,可以利用最新的並行導出和還原功能,同時可以減少數據庫膨脹問題。

邏輯備份與還原非常簡單但速度比較慢,停機時間取決於數據庫的大小,因此適合中小型數據庫的升級。

下面我們介紹這種升級方法的具體操作,假如當前 PostgreSQL 軟件的安裝目錄位於 /usr/local/pgsql,同時數據目錄位於 /usr/local/pgsql/data,我們在同一臺服務器上進行升級。

執行邏輯備份之前停止應用程序,確保沒有數據更新,因為備份開始後的更新不會被導出。如有必要,可以修改 /usr/local/pgsql/data/pg_hba.conf 文件禁止其他人訪問數據庫。

然後備份數據庫:

pg_dumpall > outputfile

如果已經安裝瞭新版本的 PostgreSQL,可以使用新版本的 pg_dumpall 命令備份舊版本數據庫。

停止舊版本的後臺服務:

pg_ctl stop

或者通過其他方式停止後臺服務。

如果安裝目錄沒有包含特定版本標識,可以將目錄改名,必要時可以再修改回來。可以使用類似以下的命令重命名目錄:

mv /usr/local/pgsql /usr/local/pgsql.old

安裝新版本 PostgreSQL 軟件,假如安裝目錄仍然是 /usr/local/pgsql。

初始化一個新的數據庫集群,需要使用數據庫專用用戶(通常是 postgres;如果是升級版本,應該已經存在該用戶)執行操作:

/usr/local/pgsql/bin/initdb -D /usr/local/pgsql/data

將舊版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改動在對應的新配置文件中再次進行修改。

使用數據庫專用用戶啟動新版本的後臺服務:

 /usr/local/pgsql/bin/postgres -D /usr/local/pgsql/data

最後,利用新版本的 psql 命令還原數據:

/usr/local/pgsql/bin/psql -d postgres -f outputfile

為瞭減少停機時間,可以將新版本的 PostgreSQL 安裝到另一個目錄(例如 /usr/local/pgsql-13),同時使用不同的端口啟動服務。然後同時執行數據庫的導出和導入:

pg_dumpall -p 5432 | psql -d postgres -p 5433

執行以上操作時,新舊版本的後臺服務同時運行,新版本使用 5433 端口,舊版本使用 5432 端口。

利用 pg_upgrade 工具進行升級

pg_upgrade 工具可以支持 PostgreSQL 跨版本的就地升級,不需要執行導出和導入操作。pg_upgrade 可以支持 PostgreSQL 8.4.X 到最新版本的升級,包括快照版本和測試版本。

pg_upgrade 提供瞭升級前的兼容性檢查(-c 或者 –check 選項)功能, 可以發現插件、數據類型不兼容等問題。如果指定瞭 –link 選項,新版本服務可以直接使用原有的數據庫文件而不需要執行復制,通常可以在幾分鐘內完成升級操作。

下面我們介紹這種升級方法的具體操作,假如當前 PostgreSQL 軟件的安裝目錄位於 /usr/pgsql-12/,同時數據目錄位於 /var/lib/pgsql/12/data/,我們將其升級為 PostgreSQL 13。

確定沒有客戶端訪問之後備份數據庫,然後停止舊版本的後臺服務。例如 CentOS 可以執行以下命令:

sudo systemctl stop postgresql-12
sudo systemctl disable postgresql-12

安裝新版本的 PostgreSQL 軟件。例如 PostgreSQL 13.0,安裝目錄位於 /usr/pgsql-13/。

初始化新版本的數據庫集群。數據目錄設置為 /var/lib/pgsql/13/data/。

如果舊版本中安裝瞭擴展模塊,在新版本中也需要安裝相應的共享對象文件或者 DLL 文件。但是不要執行CREATE EXTENSION命令,因為會從舊數據庫中進行升級。另外,如果使用瞭任何自定義的全文搜索文件(字典、同義詞、詞庫、停用詞),也需要復制到新的數據庫集群目錄中。

停止新版本的後臺服務。例如 CentOS 可以執行以下命令:

sudo systemctl stop postgresql-13

通過 pg_upgrade 執行升級操作,使用數據庫專用用戶(通常是 postgres)執行以下操作:

/usr/pgsql-13/bin/pg_upgrade \
 --old-datadir /var/lib/pgsql/12/data/ \
 --new-datadir /var/lib/pgsql/13/data/ \
 --old-bindir /usr/pgsql-12/bin/ \
 --new-bindir /usr/pgsql-13/bin/ \
 --check

其中 –check 表示執行升級檢查,而不會真的執行升級操作。通過檢查之後,可以去掉該參數執行升級:

/usr/pgsql-13/bin/pg_upgrade \
 --old-datadir /var/lib/pgsql/12/data/ \
 --new-datadir /var/lib/pgsql/13/data/ \
 --old-bindir /usr/pgsql-12/bin/ \
 --new-bindir /usr/pgsql-13/bin/ \
 --link

其中 –link 表示將新版本的數據目錄硬鏈接到舊版本的數據目錄,而不會復制一份新的數據文件,可以快速進行升級。

將舊版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改動在對應的新配置文件中再次進行修改。

啟動新版本的後臺服務。例如 CentOS 可以執行以下命令:

sudo systemctl start postgresql-13
sudo systemctl enable postgresql-13

連接服務器查看數據庫的版本信息:

SELECT version();
version                        |
-------------------------------------------------------------------------------------------------------|
PostgreSQL 13.0 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-39), 64-bit|

收集統計信息。pg_upgrade 不會生成新版本數據庫的統計信息,但是會創建一個腳本文件,執行該文件:

./analyze_new_cluster.sh

如果確認升級成功,可以選擇刪除或者保留舊的數據庫軟件和集群。pg_upgrade 同樣提供瞭一個刪除舊數據庫集群的腳本:

 ./delete_old_cluster.sh

然後可以刪除舊版本的 PostgreSQL 軟件,例如 CentOS 可以執行以下命令:

yum remove postgresql12*

如果想要回退到舊版本的數據庫,可以分為不同的情況:

  • 如果隻運行瞭 –check 選項命令,表示沒有真正執行升級,重新啟動服務即可;
  • 如果升級時沒有使用 –link 選項,舊版本的數據庫集群沒有任何修改,重新啟動服務即可;
  • 如果升級時使用瞭 –link 選項,數據庫文件可能已經被新版本的集群使用:
  1. 如果 pg_upgrade 在鏈接操作之前終止,舊版本的數據庫集群沒有任何修改,重新啟動服務即可;
  2. 如果沒有啟動過新版本的後臺服務,舊版本的數據庫集群沒有修改,但是鏈接過程已經將 $PGDATA/global/pg_control 文件重命名為 $PGDATA/global/pg_control.old;此時需要將該文件名中的 .old 後綴去掉,然後重新啟動服務即可;
  3. 如果已經啟動瞭新版本的數據庫集群,已經修改瞭數據庫文件,再啟動舊版本的服務可能導致數據損壞;此時需要通過備份文件還原舊版本的數據庫。

關於 pg_upgrade 的詳細使用和升級註意事項,例如流復制結構和日志傳輸復制結構中備用節點的升級,可以參考官方文檔。

使用邏輯復制功能進行升級

邏輯復制

PostgreSQL 邏輯復制支持跨版本之間的數據復制,而且支持不同平臺之間的復制,因此也可以用於實現版本升級。我們可以安裝一個新版本的數據庫作為復制的從節點,當數據已經同步時執行一次主從切換,然後關閉舊版本的主節點。主從切換的升級方法通常隻需要幾秒鐘就能完成,利用第三方高可用組件甚至可以實現零停機時間升級。

PostgreSQL 10 開始提供瞭內置的邏輯復制功能,或者也可以使用 pglogical、Slony、Londiste 以及 Bucardo 等邏輯復雜工具。

關於 PostgreSQL 邏輯復制結構的創建和主從切換,可以參考官方文檔。

總結

PostgreSQL 小版本升級隻需要替換二進制文件即可,跨版本升級的方案主要有 3 種:通過 pg_dump/pg_dumpall 邏輯備份與還原進行升級,利用 pg_upgrade 工具進行升級,使用邏輯復制功能進行升級。瞭解它們的優缺點和適用場景可以幫助我們選擇最佳的升級方式。

到此這篇關於PostgreSQL 數據庫跨版本升級常用方案解析的文章就介紹到這瞭,更多相關PostgreSQL 版本升級內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: