MongoDB的備份與恢復

    任何數據庫都離不開日常的備份與恢復,這二者是數據庫安全的前提,MongoDB的備份與恢復方法一般而言都采用自帶的工具來進行。

     在開始講述備份之前,需要首先瞭解兩個概念,一個是恢復點目標、一個叫恢復時間目標,下面我們分別來看:

  • 恢復點目標:

(也叫RPO,recovery point objective)

也就是數據可以恢復到哪個時間點,可以承受多少損失。

  • 恢復時間目標:

(也叫RTO,recover time objective),在發生故障的時候,數據庫可以承受多長時間宕機。

有瞭這兩個概念,就可以理解不同備份恢復方法可以滿足的RPO和RTO是多少瞭。

來看備份工具:

Mongodump工具

在MongoDB中,mongodump工具通常用來做備份使用。它有如下特點:

1、可以對mongos和mongod進行操作

2、備份的是數據和數據結構,會以bson數據格式存儲

3、不會備份索引,隻會備份索引的元數據,隻有在恢復的時候才會重建索引。

4、備份的過程中,mongodump會批量的將數據加載到內存中,該方法在數據量比較大的時候,會持續占用內存資源,會增加IO負載壓力。

5、可以備份整個數據庫、整個集合、部分集合內容

該工具的缺點:

1、僅僅適合備份小型的、或者單一數據庫的備份

2、數據量大的時候,備份時間較長

關於Mongodump的命令使用方法,大傢可以mongodump –help去查看,常用選項如下:

-p,–port:端口

-h,–host:IP地址

-d,–db:數據庫

-c,–collection:備份的集合名稱

-q,–query:備份數據的條件表達式

-o,–out:備份文件的存放位置

-u,–username:用戶名

-p,–password:密碼

–authenticationDataBase:認證數據庫

具體的使用方法,下面有例子。

Mongorestore工具

   數據備份和數據恢復二者是不可分割的,因為數據的備份,本質上還是為瞭恢復準備的,如果備份的數據不能恢復,那麼備份也就失去瞭意義。

    在MongoDB中,Mongorestore這個工具是用來做數據恢復的,數據恢復命令的常用參數如下:

與mongodump重復的部分不再贅述

-p,–port

-h,–host

-d,–db

-c,–collection

–dir:恢復文件存放的位置,如果指定瞭數據庫文件夾或者集合文件,則隻恢復當前數據庫或者當前集合,如果沒有指定,則恢復當前目錄下所有備份數據。

–drop:恢復前會刪除已有的數據庫

-u,–user

-p,–password

–authenticationDatabase

下面來看樣例:

數據備份舉例

備份所有數據庫
mongodump --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 
2020-11-23T23:40:41.599+0800 writing admin.system.users to 
2020-11-23T23:40:41.626+0800 done dumping admin.system.users (3 documents)
2020-11-23T23:40:41.626+0800 writing admin.system.roles to 
2020-11-23T23:40:41.651+0800 done dumping admin.system.roles (1 document)
2020-11-23T23:40:41.651+0800 writing admin.system.version to 
2020-11-23T23:40:41.680+0800 done dumping admin.system.version (2 documents)
2020-11-23T23:40:41.680+0800 writing test.yeyz to 
2020-11-23T23:40:41.680+0800 writing yeyz.test to 
2020-11-23T23:40:41.726+0800 done dumping yeyz.test (2 documents)
2020-11-23T23:40:41.727+0800 done dumping test.yeyz (3 documents)

備份yeyz這一個數據庫
[[email protected] ~]# mongodump -d yeyz --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 --authenticationDatabase admin   
2020-11-23T23:41:58.991+0800 writing yeyz.test to 
2020-11-23T23:41:59.050+0800 done dumping yeyz.test (2 documents)

備份yeyz數據庫中的test集合中的name=ccc的記錄
[[email protected] ~]# mongodump -d yeyz -c test -q '{name:{$eq:"ccc"}}' --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 --authenticationDatabase admin
2020-11-23T23:43:24.473+0800 writing yeyz.test to 
2020-11-23T23:43:24.501+0800 done dumping yeyz.test (1 document)

數據恢復舉例

恢復前
> use yeyz
switched to db yeyz
> show tables;
test
> db.test.find()
{ "_id" : ObjectId("5fa7eae2515b814f18f2d474"), "name" : "ccc" }
{ "_id" : ObjectId("5fa7f00e523d80402cdfa326"), "name" : "bbb" }

恢復後
> show tables;
test
test_recover
> db.test_recover.find()
{ "_id" : ObjectId("5fa7eae2515b814f18f2d474"), "name" : "ccc" }

我們成功的將上面的yeyz數據庫中的test集合中的name=ccc的記錄恢復到瞭test_recover這個集合當中。

物理備份

    物理備份的概念大傢應該都理解,常用的方法是復制物理硬盤上的數據庫文件。

    想要保證復制的物理文件和真實的數據庫文件一致,需要保證當前數據庫沒有寫入。如果數據庫有寫入,則復制的數據是不準確的。所以,物理復制必須在MongoDB實例停機狀態或者鎖定狀態下進行。一般來講,在MongoDB集群中,我們會使用鎖定從庫的辦法來進行備份。

    通常情況下,使用:

db.fsyncLock()  鎖定從數據庫。

db.fsyncUnlock() 解鎖數據庫

    鎖定從節點的數據庫之後,在從節點上使用物理文件拷貝的方式進行備份即可。

    備份完成即可解鎖數據庫。

最後,數據備份的時候,如果有寫入,那麼備份的數據是否會不準確?例如下面這樣:

如果我們的備份進度處在中間位置,即:

    A庫備份完成的時候,B庫沒有開始備份

此時分別寫入A庫和B庫兩個文檔,則最終的備份結果中,A庫的數據沒有新增的數據,B庫的數據有新增的數據,就會產生數據的不一致。為瞭解決這個問題,備份一般都使用鎖定數據庫或者停止實例的方法來解決。

    在MongoDB中,可以在從庫上進行鎖定或者停止實例的備份操作,不建議在線上環境使用MongoDB單庫,因為這種情況,備份恢復將會成為一個瓶頸問題。

以上就是MongoDB的備份與恢復的詳細內容,更多關於MongoDB 備份與恢復的資料請關註WalkonNet其它相關文章!