MongoDB的備份與恢復

Posted on 2021-03-24 by WalkonNet

任何數據庫都離不開日常的備份與恢復，這二者是數據庫安全的前提，MongoDB的備份與恢復方法一般而言都采用自帶的工具來進行。

在開始講述備份之前，需要首先瞭解兩個概念，一個是恢復點目標、一個叫恢復時間目標,下面我們分別來看：

恢復點目標：

（也叫RPO，recovery point objective）

也就是數據可以恢復到哪個時間點，可以承受多少損失。

恢復時間目標：

(也叫RTO，recover time objective)，在發生故障的時候，數據庫可以承受多長時間宕機。

有瞭這兩個概念，就可以理解不同備份恢復方法可以滿足的RPO和RTO是多少瞭。

來看備份工具：

Mongodump工具

在MongoDB中，mongodump工具通常用來做備份使用。它有如下特點：

1、可以對mongos和mongod進行操作

2、備份的是數據和數據結構，會以bson數據格式存儲

3、不會備份索引，隻會備份索引的元數據，隻有在恢復的時候才會重建索引。

4、備份的過程中，mongodump會批量的將數據加載到內存中，該方法在數據量比較大的時候，會持續占用內存資源，會增加IO負載壓力。

5、可以備份整個數據庫、整個集合、部分集合內容

該工具的缺點：

1、僅僅適合備份小型的、或者單一數據庫的備份

2、數據量大的時候，備份時間較長

關於Mongodump的命令使用方法，大傢可以mongodump –help去查看，常用選項如下：

-p，–port：端口

-h，–host：IP地址

-d，–db：數據庫

-c，–collection：備份的集合名稱

-q，–query：備份數據的條件表達式

-o，–out：備份文件的存放位置

-u，–username：用戶名

-p，–password：密碼

–authenticationDataBase：認證數據庫

具體的使用方法，下面有例子。

Mongorestore工具

數據備份和數據恢復二者是不可分割的，因為數據的備份，本質上還是為瞭恢復準備的，如果備份的數據不能恢復，那麼備份也就失去瞭意義。

在MongoDB中，Mongorestore這個工具是用來做數據恢復的，數據恢復命令的常用參數如下：

與mongodump重復的部分不再贅述

-p，–port

-h，–host

-d，–db

-c，–collection

–dir：恢復文件存放的位置，如果指定瞭數據庫文件夾或者集合文件，則隻恢復當前數據庫或者當前集合，如果沒有指定，則恢復當前目錄下所有備份數據。

–drop：恢復前會刪除已有的數據庫

-u，–user

-p，–password

–authenticationDatabase

下面來看樣例：

數據備份舉例

備份所有數據庫
mongodump --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 
2020-11-23T23:40:41.599+0800 writing admin.system.users to 
2020-11-23T23:40:41.626+0800 done dumping admin.system.users (3 documents)
2020-11-23T23:40:41.626+0800 writing admin.system.roles to 
2020-11-23T23:40:41.651+0800 done dumping admin.system.roles (1 document)
2020-11-23T23:40:41.651+0800 writing admin.system.version to 
2020-11-23T23:40:41.680+0800 done dumping admin.system.version (2 documents)
2020-11-23T23:40:41.680+0800 writing test.yeyz to 
2020-11-23T23:40:41.680+0800 writing yeyz.test to 
2020-11-23T23:40:41.726+0800 done dumping yeyz.test (2 documents)
2020-11-23T23:40:41.727+0800 done dumping test.yeyz (3 documents)

備份yeyz這一個數據庫
[root@VM-0-14-centos ~]# mongodump -d yeyz --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 --authenticationDatabase admin   
2020-11-23T23:41:58.991+0800 writing yeyz.test to 
2020-11-23T23:41:59.050+0800 done dumping yeyz.test (2 documents)

備份yeyz數據庫中的test集合中的name=ccc的記錄
[root@VM-0-14-centos ~]# mongodump -d yeyz -c test -q '{name:{$eq:"ccc"}}' --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 --authenticationDatabase admin
2020-11-23T23:43:24.473+0800 writing yeyz.test to 
2020-11-23T23:43:24.501+0800 done dumping yeyz.test (1 document)

數據恢復舉例

恢復前
> use yeyz
switched to db yeyz
> show tables;
test
> db.test.find()
{ "_id" : ObjectId("5fa7eae2515b814f18f2d474"), "name" : "ccc" }
{ "_id" : ObjectId("5fa7f00e523d80402cdfa326"), "name" : "bbb" }

恢復後
> show tables;
test
test_recover
> db.test_recover.find()
{ "_id" : ObjectId("5fa7eae2515b814f18f2d474"), "name" : "ccc" }

我們成功的將上面的yeyz數據庫中的test集合中的name=ccc的記錄恢復到瞭test_recover這個集合當中。

物理備份

物理備份的概念大傢應該都理解，常用的方法是復制物理硬盤上的數據庫文件。

想要保證復制的物理文件和真實的數據庫文件一致，需要保證當前數據庫沒有寫入。如果數據庫有寫入，則復制的數據是不準確的。所以，物理復制必須在MongoDB實例停機狀態或者鎖定狀態下進行。一般來講，在MongoDB集群中，我們會使用鎖定從庫的辦法來進行備份。

通常情況下，使用：

db.fsyncLock() 鎖定從數據庫。

db.fsyncUnlock（）解鎖數據庫

鎖定從節點的數據庫之後，在從節點上使用物理文件拷貝的方式進行備份即可。

備份完成即可解鎖數據庫。

最後，數據備份的時候，如果有寫入，那麼備份的數據是否會不準確？例如下面這樣：

如果我們的備份進度處在中間位置，即：

A庫備份完成的時候，B庫沒有開始備份

此時分別寫入A庫和B庫兩個文檔，則最終的備份結果中，A庫的數據沒有新增的數據，B庫的數據有新增的數據，就會產生數據的不一致。為瞭解決這個問題，備份一般都使用鎖定數據庫或者停止實例的方法來解決。

在MongoDB中，可以在從庫上進行鎖定或者停止實例的備份操作，不建議在線上環境使用MongoDB單庫，因為這種情況，備份恢復將會成為一個瓶頸問題。

以上就是MongoDB的備份與恢復的詳細內容，更多關於MongoDB 備份與恢復的資料請關註WalkonNet其它相關文章！

MongoDB的備份與恢復

Mongodump工具

Mongorestore工具

物理備份

推薦閱讀：

發佈留言取消回覆

近期文章

Mongodump工具

Mongorestore工具

物理備份

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆