![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
||||
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
||||
|
系統上線後的日常營運作業中,監控各系統的運作狀態之事相當重要。監控系統的運作狀態才能事前發現以及處理問題,避免系統障礙發生。若系統不慎發生障礙,也能即時通知相關人員處理。
如何選擇適當的系統監控工具?必須根據「系統需求規格書」中的「營運需求要項」,去評估統合系統監控工具。如下圖所示,一般的系統監控工具主要有收集各監控對象H/W、OS、M/W、AP等運作狀態的「監控資訊收集功能」、事前掌握問題的「監控資訊分析功能」、障礙監控用「警戒值設定功能」、系統發生障礙時「障礙通知功能」、工具本身管理的「管理功能」等5大功能。

統合監控工具主要5大功能的內容說明如下表:
| 監控資訊收集功能 | ˙資源監控:透過安裝在監控對象主機的Agent,監控主機的CPU/MEMORY/DISK/NETWORK等資源的使用狀況。 ˙網路監控:透過Ping、或Port的生死來監控網路是否相通。 ˙SNMP監控:透過SNMP的Polling/Trap方式監控通訊等設備。 ˙LOG監控:利用syslog、aplog等LOG訊息監控方式,監控硬體、軟體的障礙。 ˙JOB監控:監控執行程式的工作排程、執行狀況。通常利用專門的JOB SCHEDULLING的工具,在此不做比較。 |
| 監控資訊分析功能 | 將收集到資訊以分析圖、表呈現。例如CPU/MEMORY/DISK/NETWORK等在1定期間內的使用量變化曲線圖等。 |
| 警戒值設定功能 | 設定收集到監控資訊的警戒值,判定系統是否異常。例如CPU使用率的警戒值為80%。 |
| 障礙通知功能 | 設定系統發生異常時的通報機制,例如發送簡訊、E-mail,緊急狀況發生時的電話聯絡方式等。 |
| 管理功能 | 監控主機本身的管理功能。 |
對於統合監控工具的功能如何進行評估,接下來進行說明。
在評估監控資訊收集功能的時,除了監控項目的之外,設定監控項目的容易性,以及監控訊息的保存型態也必須列入評估項目之中。
| 監控項目 | 主機硬體監控 | 監控主機硬體的障礙 |
| 資源監控 | 監控監控主機的CPU/MEMORY/DISK/NETWORK等資源 | |
| 網路監控 | 對N/W設備進行Ping、SNMP方式監控 | |
| Process監控 | 監控OS的ftp、ntp等重要Process | |
| Log監控 | 監控syslog內的異常訊息 | |
| Cluster監控 | 監控正、副主機的切換狀態 | |
| 監控項目的設定 | 設定方式 | 監控規則的設定方式 |
| 保存型態 | 監控設定檔的保存方式 | |
| 生效方式 | 監控設定完後,須不須要重新啟動 | |
| 擴充功能 | 追加外掛功能Plug-in的豐富性 | |
| 設定的容易性 | 是否可以簡單設定 | |
| 訊息保存型態 | 收集到的訊息如何保存?DB or text or ... |
|
|
|