mongos崩潰後無法重啟問題的解決方法

前言

官方文檔:https://docs.mongodb.com/manual/reference/program/mongos/#bin.mongos

mongos是MongoDB shard的縮寫,它是一個為應用層提供查詢請求並決定數據在MongoDB分片中位置的路由服務。從應用層的角度來看,mongos的行為和一個MongoDB實例是沒有區別的。

詳細的配置參數,大概瀏覽一遍官方文檔即可,需要用到的時候再去查就行瞭。

由於近期有不同用戶先後遇到SERVER-52654,做一些說明:

影響版本

所有使用MongoDB 4.2.2+,並使用瞭分片的集群。

問題現象

從上次重啟config節點,或者重新選舉90或180天後,所有mongos會同時crash,並且無法重新啟動。

問題原因

該問題是由於config節點無法正常刷新簽名密鑰導致。正常情況下存在2個密鑰,一個正在使用的,將在90天內過期,一個即將使用的將在180天內過期。SERVER-52654導致config無法正常刷新密鑰,所以在現有密鑰過期後mongos將崩潰。

修復版本

該問題將在4.2.12修復。4.2.12目前已發佈。

規避辦法

在90天內將primary節點stepDown一次即可避免該問題發生。如果想知道簽名密鑰的確切過期時間,可以連接到任意config節點,並執行以下腳本:

db.getSiblingDB("admin").system.keys.find().map(k => { return { _id: k._id, purpose: k.purpose, expiresAt: new Date(k.expiresAt.getTime()*1000) }})

如果存在2個密鑰(一個90天內過期,一個180天內過期),則暫時不用操作;如果隻有1個密鑰,則應該在90天內執行stepDown切換config主節點。

由於system.keys集合需要特殊權限方可訪問,如果遇到權限問題,可能需要以下腳本來創建必要的角色(將ADMIN更換為您使用的用戶):

use admin;
db.createRole({
 role: "query_keys",
 privileges: [
 { resource: { db: "admin", collection: "system.keys"}, actions: [ "find" ] },
 ],
 roles: [ ]
});
db.grantRolesToUser("ADMIN", ["query_keys"])

config主節點重新選舉後將產生新的過期時間,仍可通過上述腳本檢查是否已刷新。

總結

到此這篇關於mongos崩潰後無法重啟問題的解決方法的文章就介紹到這瞭,更多相關mongos崩潰後無法重啟內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: