系統統合監控工具的導入評估(一)
 
聯絡我們
會員登錄
購物車


首頁 書籤 最新訊息 其他
IT辭典 IT技術動向 IT和經營結合 系統導入 系統基盤建置 系統營運管理
張士超
東京工業大學經營工學科畢。現任IT綜合情報網編輯。

系統統合監控工具的導入評估(一)

系統上線後的日常營運作業中,監控各系統的運作狀態之事相當重要。監控系統的運作狀態才能事前發現以及處理問題,避免系統障礙發生。若系統不慎發生障礙,也能即時通知相關人員處理。

如何選擇適當的系統監控工具?必須根據「系統需求規格書」中的「營運需求要項」,去評估統合系統監控工具。如下圖所示,一般的系統監控工具主要有收集各監控對象H/W、OS、M/W、AP等運作狀態的「監控資訊收集功能」、事前掌握問題的「監控資訊分析功能」、障礙監控用「警戒值設定功能」、系統發生障礙時「障礙通知功能」、工具本身管理的「管理功能」等5大功能。



圖1:系統監控示意圖

統合監控工具主要5大功能的內容說明如下表:

監控資訊收集功能˙資源監控:透過安裝在監控對象主機的Agent,監控主機的CPU/MEMORY/DISK/NETWORK等資源的使用狀況。
˙網路監控:透過Ping、或Port的生死來監控網路是否相通。
˙SNMP監控:透過SNMP的Polling/Trap方式監控通訊等設備。
˙LOG監控:利用syslog、aplog等LOG訊息監控方式,監控硬體、軟體的障礙。
˙JOB監控:監控執行程式的工作排程、執行狀況。通常利用專門的JOB SCHEDULLING的工具,在此不做比較。
監控資訊分析功能將收集到資訊以分析圖、表呈現。例如CPU/MEMORY/DISK/NETWORK等在1定期間內的使用量變化曲線圖等。
警戒值設定功能設定收集到監控資訊的警戒值,判定系統是否異常。例如CPU使用率的警戒值為80%。
障礙通知功能設定系統發生異常時的通報機制,例如發送簡訊、E-mail,緊急狀況發生時的電話聯絡方式等。
管理功能監控主機本身的管理功能。

對於統合監控工具的功能如何進行評估,接下來進行說明。


監控資訊收集功能的比較項目

在評估監控資訊收集功能的時,除了監控項目的之外,設定監控項目的容易性,以及監控訊息的保存型態也必須列入評估項目之中。

監控項目 主機硬體監控監控主機硬體的障礙
資源監控監控監控主機的CPU/MEMORY/DISK/NETWORK等資源
網路監控對N/W設備進行Ping、SNMP方式監控
Process監控監控OS的ftp、ntp等重要Process
Log監控監控syslog內的異常訊息
Cluster監控監控正、副主機的切換狀態
監控項目的設定 設定方式監控規則的設定方式
保存型態監控設定檔的保存方式
生效方式監控設定完後,須不須要重新啟動
擴充功能追加外掛功能Plug-in的豐富性
設定的容易性是否可以簡單設定
訊息保存型態收集到的訊息如何保存?DB or text or ...

top