我理解這是系統(tǒng)hung住了,遇到這樣的情況,應(yīng)該在業(yè)務(wù)低峰可接受停機(jī)的時(shí)間段強(qiáng)制重啟,這個(gè)過程注意數(shù)據(jù)保護(hù),有下面幾種服務(wù)器處理場(chǎng)景
1,無狀態(tài)web服務(wù)器,這樣的服務(wù)器一般都會(huì)有多個(gè)節(jié)點(diǎn),那么在業(yè)務(wù)低峰的時(shí)候強(qiáng)制重啟就行。
2,應(yīng)用服務(wù)器,這種服務(wù)器一般也是有多個(gè)節(jié)點(diǎn),確定數(shù)據(jù)是否已備份,比如是否每日都做了crontab自動(dòng)備份,在自動(dòng)備份剛結(jié)束就立即強(qiáng)制重啟,這樣數(shù)據(jù)丟失的可能性最低。
3,數(shù)據(jù)庫服務(wù)器,同上,而且還要注意是主節(jié)點(diǎn)還是備節(jié)點(diǎn),是否做了自動(dòng)的主被切換等等
無論什么情況,數(shù)據(jù)安全是最核心的,只要保證數(shù)據(jù)安全,其他的都好說。