MongoDB的備份與恢復
任何數據庫都離不開日常的備份與恢復,這二者是數據庫安全的前提,MongoDB的備份與恢復方法一般而言都采用自帶的工具來進行。
在開始講述備份之前,需要首先瞭解兩個概念,一個是恢復點目標、一個叫恢復時間目標,下面我們分別來看:
- 恢復點目標:
(也叫RPO,recovery point objective)
也就是數據可以恢復到哪個時間點,可以承受多少損失。
- 恢復時間目標:
(也叫RTO,recover time objective),在發生故障的時候,數據庫可以承受多長時間宕機。
有瞭這兩個概念,就可以理解不同備份恢復方法可以滿足的RPO和RTO是多少瞭。
來看備份工具:
Mongodump工具
在MongoDB中,mongodump工具通常用來做備份使用。它有如下特點:
1、可以對mongos和mongod進行操作
2、備份的是數據和數據結構,會以bson數據格式存儲
3、不會備份索引,隻會備份索引的元數據,隻有在恢復的時候才會重建索引。
4、備份的過程中,mongodump會批量的將數據加載到內存中,該方法在數據量比較大的時候,會持續占用內存資源,會增加IO負載壓力。
5、可以備份整個數據庫、整個集合、部分集合內容
該工具的缺點:
1、僅僅適合備份小型的、或者單一數據庫的備份
2、數據量大的時候,備份時間較長
關於Mongodump的命令使用方法,大傢可以mongodump –help去查看,常用選項如下:
-p,–port:端口
-h,–host:IP地址
-d,–db:數據庫
-c,–collection:備份的集合名稱
-q,–query:備份數據的條件表達式
-o,–out:備份文件的存放位置
-u,–username:用戶名
-p,–password:密碼
–authenticationDataBase:認證數據庫
具體的使用方法,下面有例子。
Mongorestore工具
數據備份和數據恢復二者是不可分割的,因為數據的備份,本質上還是為瞭恢復準備的,如果備份的數據不能恢復,那麼備份也就失去瞭意義。
在MongoDB中,Mongorestore這個工具是用來做數據恢復的,數據恢復命令的常用參數如下:
與mongodump重復的部分不再贅述
-p,–port
-h,–host
-d,–db
-c,–collection
–dir:恢復文件存放的位置,如果指定瞭數據庫文件夾或者集合文件,則隻恢復當前數據庫或者當前集合,如果沒有指定,則恢復當前目錄下所有備份數據。
–drop:恢復前會刪除已有的數據庫
-u,–user
-p,–password
–authenticationDatabase
下面來看樣例:
數據備份舉例
備份所有數據庫 mongodump --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 2020-11-23T23:40:41.599+0800 writing admin.system.users to 2020-11-23T23:40:41.626+0800 done dumping admin.system.users (3 documents) 2020-11-23T23:40:41.626+0800 writing admin.system.roles to 2020-11-23T23:40:41.651+0800 done dumping admin.system.roles (1 document) 2020-11-23T23:40:41.651+0800 writing admin.system.version to 2020-11-23T23:40:41.680+0800 done dumping admin.system.version (2 documents) 2020-11-23T23:40:41.680+0800 writing test.yeyz to 2020-11-23T23:40:41.680+0800 writing yeyz.test to 2020-11-23T23:40:41.726+0800 done dumping yeyz.test (2 documents) 2020-11-23T23:40:41.727+0800 done dumping test.yeyz (3 documents) 備份yeyz這一個數據庫 [root@VM-0-14-centos ~]# mongodump -d yeyz --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 --authenticationDatabase admin 2020-11-23T23:41:58.991+0800 writing yeyz.test to 2020-11-23T23:41:59.050+0800 done dumping yeyz.test (2 documents) 備份yeyz數據庫中的test集合中的name=ccc的記錄 [root@VM-0-14-centos ~]# mongodump -d yeyz -c test -q '{name:{$eq:"ccc"}}' --port=27017 -h 127.0.0.1 -o /data/mongodb_backup -u root -p 123456 --authenticationDatabase admin 2020-11-23T23:43:24.473+0800 writing yeyz.test to 2020-11-23T23:43:24.501+0800 done dumping yeyz.test (1 document)
數據恢復舉例
恢復前 > use yeyz switched to db yeyz > show tables; test > db.test.find() { "_id" : ObjectId("5fa7eae2515b814f18f2d474"), "name" : "ccc" } { "_id" : ObjectId("5fa7f00e523d80402cdfa326"), "name" : "bbb" } 恢復後 > show tables; test test_recover > db.test_recover.find() { "_id" : ObjectId("5fa7eae2515b814f18f2d474"), "name" : "ccc" }
我們成功的將上面的yeyz數據庫中的test集合中的name=ccc的記錄恢復到瞭test_recover這個集合當中。
物理備份
物理備份的概念大傢應該都理解,常用的方法是復制物理硬盤上的數據庫文件。
想要保證復制的物理文件和真實的數據庫文件一致,需要保證當前數據庫沒有寫入。如果數據庫有寫入,則復制的數據是不準確的。所以,物理復制必須在MongoDB實例停機狀態或者鎖定狀態下進行。一般來講,在MongoDB集群中,我們會使用鎖定從庫的辦法來進行備份。
通常情況下,使用:
db.fsyncLock() 鎖定從數據庫。
db.fsyncUnlock() 解鎖數據庫
鎖定從節點的數據庫之後,在從節點上使用物理文件拷貝的方式進行備份即可。
備份完成即可解鎖數據庫。
最後,數據備份的時候,如果有寫入,那麼備份的數據是否會不準確?例如下面這樣:
如果我們的備份進度處在中間位置,即:
A庫備份完成的時候,B庫沒有開始備份
此時分別寫入A庫和B庫兩個文檔,則最終的備份結果中,A庫的數據沒有新增的數據,B庫的數據有新增的數據,就會產生數據的不一致。為瞭解決這個問題,備份一般都使用鎖定數據庫或者停止實例的方法來解決。
在MongoDB中,可以在從庫上進行鎖定或者停止實例的備份操作,不建議在線上環境使用MongoDB單庫,因為這種情況,備份恢復將會成為一個瓶頸問題。
以上就是MongoDB的備份與恢復的詳細內容,更多關於MongoDB 備份與恢復的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- MongoDB mongoexport工具的使用簡介
- MongoDB 簡單入門教程(安裝、基本概念、創建用戶)
- MongoDB 常用的數據類型和基本操作
- 淺析MongoDB之安全認證
- 教你使用MongoDB導入導出備份數據