MongoDB mongoexport工具的使用簡介

01  基本介紹

   mongoexport是一個數據導出的工具,使用的時候類似mysql中的select into outfile語法,可以將某個數據庫中的數據以json或者csv的格式導出來。

我們可以通過直接連接mongos或者連接mongod來導出數據。如果你的集群是分片集群,連接mongos會導出所有分片上這個集合的相關數據。

02  常用參數

-h:指明數據庫宿主機的IP

-u:指明數據庫的用戶名

-p:指明數據庫的密碼

-d:指明數據庫的名字

-c:指明collection的名字

-f:指明要導入那些列

–type:默認是json類型,可以導出csv類型

-o:指明要導出的文件名稱,如果不指定,則導出到標準輸出

-q:查詢過濾器,可以輸入一個json,從而導出查詢後的結果

上面的常用參數還有對應的長參數選項,例如-h也可以輸入–host代替。參數的詳細介紹,可以通過mongoexport –help獲取到。

03  命令

1、導出數據庫new下面的test集合的number字段,命令如下:

mongoexport --port=27016 -u "yeyz" --authenticationDatabase "admin" -p "123456" -d new -c test --fields=number -o /data/test.json
2021-02-23T22:09:52.481+0800 connected to: localhost:27016
2021-02-23T22:09:52.512+0800 exported 2000 records

我們看下導出的結果:

{"_id":{"$oid":"6006c46993a711b384cc8c92"},"number":1000.0}
{"_id":{"$oid":"6006c46993a711b384cc8c93"},"number":1001.0}
{"_id":{"$oid":"6006c46993a711b384cc8c94"},"number":1002.0}
{"_id":{"$oid":"6006c46993a711b384cc8c95"},"number":1003.0}
{"_id":{"$oid":"6006c46993a711b384cc8c96"},"number":1004.0}
{"_id":{"$oid":"6006c46993a711b384cc8c97"},"number":1005.0}
{"_id":{"$oid":"6006c46993a711b384cc8c98"},"number":1006.0}
{"_id":{"$oid":"6006c46993a711b384cc8c99"},"number":1007.0}
{"_id":{"$oid":"6006c46993a711b384cc8c9a"},"number":1008.0}
{"_id":{"$oid":"6006c46993a711b384cc8c9b"},"number":1009.0}
{"_id":{"$oid":"6006c46993a711b384cc8c9c"},"number":1010.0}
{"_id":{"$oid":"6006c46993a711b384cc8c9d"},"number":1011.0}
{"_id":{"$oid":"6006c46993a711b384cc8c9e"},"number":1012.0}

可以看到,即使我們隻指定瞭number字段,也會自動為我們導出_id字段,由此可以得出結論,:如果導出的格式是json類型的,_id字段是默認導出的。

默認導出的類型是json類型,如果我們想導出csv類型,可以增加–type=csv參數。添加瞭這個參數之後,結果如下:

number
1000
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
1011

可以看到,就不會自動的輸出_id這個字段瞭。這個可能也是一個值得討論的點。我認為可能是這個工具的一個小bug,csv類型不輸出_id字段,而json類型輸出_id字段。

2、導出某個特定的查詢結果,例如導出number=10的那條記錄:

[root@VM-0-14-centos ~]# mongoexport --port=27016 -u "yeyz" --authenticationDatabase "admin" -p "123456" -d new -c test --type=csv -q {"number":10} --fields=number -o /data/test.json 
2021-02-23T22:38:18.319+0800 connected to: localhost:27016
2021-02-23T22:38:18.321+0800 exported 1 record

可以直接在-q參數後面跟查詢條件。

04  經驗值

   今天的操作是在分片集群上進行操作的,一共7個分片,我導出瞭3億多條數據,單個分片上大概5000w條數據吧,每條數據導出2個字段,每個分片上的導出時間大約在2個小時左右。

機器硬件配置:

  • SATA硬盤4TB
  • 普通內存128G
  • intel 至強E5-4系列

當然,這個值隻是個經驗值,如果你的導出的字段比較多的話,或者字段的長度比較長,可能這個值沒有太多的參考意義。

在實際進行數據導出的時候,發現執行導出的mongodb服務器負載有一定上升,內存使用率有一定上升,但是沒有特別明顯性能抖動,整個過程不會鎖數據庫,所以還是比較安全的。

線上操作的時候,尤其是針對敏感的業務,為瞭最大程度上降低對業務的影響,如果你是在mongos上執行數據導出,建議先保證這個mongos對業務不可見,執行導出之後,在重新對外提供服務;如果你是在mongod上進行數據導出,則最好選擇secondary節點進行,避免對線上業務的影響。

05  反向導入

   mongodb還有一個工具,叫mongoimport,可以將mongoexport導出的數據導入到mongodb數據庫中,下面是一個mongoimport的命令:

[root@VM-0-14-centos ~]# mongoimport --port=27016 -u "yeyz" --authenticationDatabase "admin" -p "123456" -d new -c test1 --type=csv --fields=number --file=/data/test.csv
2021-02-23T22:44:21.930+0800 connected to: localhost:27016
2021-02-23T22:44:22.146+0800 imported 2001 documents

   mongoimport的整個操作類似insert操作,參數方面和mongoexport大同小異,唯一多的比較重要的參數就是writeconcern的值,這個值設置的級別越高,那麼導出數據的時間就越慢,但是數據安全性會越高。

詳細內容請看官方文檔對writeconcern的描述。

今天的內容就到這裡。

以上就是MongoDB mongoexport工具的使用簡介的詳細內容,更多關於MongoDB mongoexport工具的使用的資料請關註WalkonNet其它相關文章!

推薦閱讀: