MongoDB mongoexport工具的使用簡介
01 基本介紹
mongoexport是一個數據導出的工具,使用的時候類似mysql中的select into outfile語法,可以將某個數據庫中的數據以json或者csv的格式導出來。
我們可以通過直接連接mongos或者連接mongod來導出數據。如果你的集群是分片集群,連接mongos會導出所有分片上這個集合的相關數據。
02 常用參數
-h:指明數據庫宿主機的IP
-u:指明數據庫的用戶名
-p:指明數據庫的密碼
-d:指明數據庫的名字
-c:指明collection的名字
-f:指明要導入那些列
–type:默認是json類型,可以導出csv類型
-o:指明要導出的文件名稱,如果不指定,則導出到標準輸出
-q:查詢過濾器,可以輸入一個json,從而導出查詢後的結果
上面的常用參數還有對應的長參數選項,例如-h也可以輸入–host代替。參數的詳細介紹,可以通過mongoexport –help獲取到。
03 命令
1、導出數據庫new下面的test集合的number字段,命令如下:
mongoexport --port=27016 -u "yeyz" --authenticationDatabase "admin" -p "123456" -d new -c test --fields=number -o /data/test.json 2021-02-23T22:09:52.481+0800 connected to: localhost:27016 2021-02-23T22:09:52.512+0800 exported 2000 records
我們看下導出的結果:
{"_id":{"$oid":"6006c46993a711b384cc8c92"},"number":1000.0} {"_id":{"$oid":"6006c46993a711b384cc8c93"},"number":1001.0} {"_id":{"$oid":"6006c46993a711b384cc8c94"},"number":1002.0} {"_id":{"$oid":"6006c46993a711b384cc8c95"},"number":1003.0} {"_id":{"$oid":"6006c46993a711b384cc8c96"},"number":1004.0} {"_id":{"$oid":"6006c46993a711b384cc8c97"},"number":1005.0} {"_id":{"$oid":"6006c46993a711b384cc8c98"},"number":1006.0} {"_id":{"$oid":"6006c46993a711b384cc8c99"},"number":1007.0} {"_id":{"$oid":"6006c46993a711b384cc8c9a"},"number":1008.0} {"_id":{"$oid":"6006c46993a711b384cc8c9b"},"number":1009.0} {"_id":{"$oid":"6006c46993a711b384cc8c9c"},"number":1010.0} {"_id":{"$oid":"6006c46993a711b384cc8c9d"},"number":1011.0} {"_id":{"$oid":"6006c46993a711b384cc8c9e"},"number":1012.0}
可以看到,即使我們隻指定瞭number字段,也會自動為我們導出_id字段,由此可以得出結論,:如果導出的格式是json類型的,_id字段是默認導出的。
默認導出的類型是json類型,如果我們想導出csv類型,可以增加–type=csv參數。添加瞭這個參數之後,結果如下:
number 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011
可以看到,就不會自動的輸出_id這個字段瞭。這個可能也是一個值得討論的點。我認為可能是這個工具的一個小bug,csv類型不輸出_id字段,而json類型輸出_id字段。
2、導出某個特定的查詢結果,例如導出number=10的那條記錄:
[root@VM-0-14-centos ~]# mongoexport --port=27016 -u "yeyz" --authenticationDatabase "admin" -p "123456" -d new -c test --type=csv -q {"number":10} --fields=number -o /data/test.json 2021-02-23T22:38:18.319+0800 connected to: localhost:27016 2021-02-23T22:38:18.321+0800 exported 1 record
可以直接在-q參數後面跟查詢條件。
04 經驗值
今天的操作是在分片集群上進行操作的,一共7個分片,我導出瞭3億多條數據,單個分片上大概5000w條數據吧,每條數據導出2個字段,每個分片上的導出時間大約在2個小時左右。
機器硬件配置:
- SATA硬盤4TB
- 普通內存128G
- intel 至強E5-4系列
當然,這個值隻是個經驗值,如果你的導出的字段比較多的話,或者字段的長度比較長,可能這個值沒有太多的參考意義。
在實際進行數據導出的時候,發現執行導出的mongodb服務器負載有一定上升,內存使用率有一定上升,但是沒有特別明顯性能抖動,整個過程不會鎖數據庫,所以還是比較安全的。
線上操作的時候,尤其是針對敏感的業務,為瞭最大程度上降低對業務的影響,如果你是在mongos上執行數據導出,建議先保證這個mongos對業務不可見,執行導出之後,在重新對外提供服務;如果你是在mongod上進行數據導出,則最好選擇secondary節點進行,避免對線上業務的影響。
05 反向導入
mongodb還有一個工具,叫mongoimport,可以將mongoexport導出的數據導入到mongodb數據庫中,下面是一個mongoimport的命令:
[root@VM-0-14-centos ~]# mongoimport --port=27016 -u "yeyz" --authenticationDatabase "admin" -p "123456" -d new -c test1 --type=csv --fields=number --file=/data/test.csv 2021-02-23T22:44:21.930+0800 connected to: localhost:27016 2021-02-23T22:44:22.146+0800 imported 2001 documents
mongoimport的整個操作類似insert操作,參數方面和mongoexport大同小異,唯一多的比較重要的參數就是writeconcern的值,這個值設置的級別越高,那麼導出數據的時間就越慢,但是數據安全性會越高。
詳細內容請看官方文檔對writeconcern的描述。
今天的內容就到這裡。
以上就是MongoDB mongoexport工具的使用簡介的詳細內容,更多關於MongoDB mongoexport工具的使用的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- MongoDB的備份與恢復
- 教你使用MongoDB導入導出備份數據
- MongoDB 簡單入門教程(安裝、基本概念、創建用戶)
- centos離線安裝mongodb-database-tools方法詳解
- MongoDB 主分片(primary shard)相關總結