1、監(jiān)控系統(tǒng)概念
監(jiān)控系統(tǒng)應(yīng)用在監(jiān)控硬件、軟件和業(yè)務(wù)上,并及時獲取相應(yīng)的數(shù)據(jù)并分析保存數(shù)據(jù),發(fā)送報警通知管理者,并自動做出相應(yīng)的處理,通過接口展示以利于運維人員分析,保證業(yè)務(wù)的正常運行。
2、運維監(jiān)控系統(tǒng)具備以下幾個模塊:
采樣:從被監(jiān)控主機上周期性地獲取某個關(guān)注指標(biāo)相關(guān)的數(shù)據(jù),常見獲取數(shù)據(jù)通道有:ssh/telnet、agent、IPMI、SNMP、JMX等等
存儲:用于存儲被監(jiān)控主機采樣的數(shù)據(jù)和分析的數(shù)據(jù),利于調(diào)用和分析,常用的有mysql、mariadb等數(shù)據(jù)庫
數(shù)據(jù):分析被監(jiān)控主機采樣數(shù)據(jù),計算出歷史數(shù)據(jù)、趨勢數(shù)據(jù)、速率、最大最小值等等。
展示:將被監(jiān)控主機的數(shù)據(jù)通過圖表方式展現(xiàn)出來,利于觀察比對,常見的展示接口有:webGUI、GUI、APP等等。
報警:當(dāng)被監(jiān)控主機發(fā)生異常時,系統(tǒng)用于通知相關(guān)人員的報警媒介。常用的報警媒介有:郵件、短信、微信或通過腳本實施。
3、被監(jiān)控對象: 主機、服務(wù)器、交換機、路由器、ups等
NMS:網(wǎng)絡(luò)監(jiān)控主機NMS是移動通信網(wǎng)中的網(wǎng)絡(luò)管理系統(tǒng),它的管理對象可以包括網(wǎng)絡(luò)中所有的實體,如:網(wǎng)絡(luò)設(shè)備、應(yīng)用程序、服務(wù)器系統(tǒng)、路由器、交換機、HUB、輔助設(shè)備(如UPS電源)等,給網(wǎng)絡(luò)系統(tǒng)管理員提供一個全系統(tǒng)的網(wǎng)絡(luò)視圖。
4、監(jiān)控系統(tǒng)采取的數(shù)據(jù)通道
ssh/telnet:安全傳輸協(xié)議
agent方式:代理方式,由監(jiān)控主機(master)和安裝代理進(jìn)程的被監(jiān)控主機(agent)組成
ipmi:因特爾智慧平臺,硬件監(jiān)控接口
snmp:簡單網(wǎng)絡(luò)管理協(xié)議,版本有 v1,v2(community ,pulic)v3
JMX:java管理擴展
jvm:監(jiān)控java虛擬機
5、儲存系統(tǒng)
歷史數(shù)據(jù) :每次采樣的結(jié)果。保存時長較短
趨勢數(shù)據(jù): 聚合數(shù)據(jù),保存時長較長周期內(nèi)的數(shù)據(jù)
存儲系統(tǒng):
關(guān)系型數(shù)據(jù)庫: mysql pgsql oracle
rrd: roudrobin database
nosql:redis、mongo、時間序列數(shù)據(jù)庫