NEBULA
 

高效率且多面性的監控技術

  • Ping監控:利用Ping的方式檢查主機是否仍在線上提供服務。
  • Port監控:檢查特定Port是否可以正常存取(TCP/UDP) 。
  • Web網址監控:檢查Web URL是否正常運作(可以由Status Code、Response Header、Response Content判斷) 。
  • Windows服務監控:檢查Windows Service是否正常執行。
  • IIS應用程式集區監控:檢查Application Pool是否正常運作。
  • Windows事件檢視器監控:使用者可針對目標伺服器上事件紀錄(EventLog)的特定事件進行監控,此項目僅包含Windows記錄,當發現有錯誤的事件發生時,就發出告警。
  • SQL Server連線監控:使用者可監控指定的資料庫查看資料庫是否正常運行,除了會嘗試登入資料庫,還會進行查詢作業,確保該資料庫是真的在正常運行。
  • Windows硬碟大小監控:使用者可監控指定的目標伺服器上特定磁碟的剩餘空間,查看該空間的剩餘量是否低於告警臨界值,如低於告警臨界值就發出告警。
  • Windows效能監控:使用者可監控目標伺服器上的CPU、Memory、Disk I/O、Network I/O...等六項效能指標,當超過告警臨界值時就發告警。
  • 自訂義推播訊息(API)監控:使用者藉由產生Token進行驗證,將欲推播的訊息傳至NIMBUS Watch,由NIMBUS Watch完成訊息的推播。
  • SQL Server交易記錄檔大小監控:使用者可監控SQL伺服器中資料庫的交易紀錄檔案大小並設定告警臨界值,如超過則發告警通知。
  • SQL Server工作排程監控:使用者可監控目標SQL伺服器的SQL Agent作業,是否為停用及最近一次的執行結果是否為異常,如有上述狀況則發告警通知。
  • SQL Server資料鎖定監控:使用者可監控SQL伺服器資料庫是否有資料鎖定(Lock)的狀況並設定臨界值,當鎖定時間超過臨界值則發告警通知。
  • 執行SQL指令監控:使用者可監控目標SQL伺服器,透過輸入指令判斷回傳筆數是否符合預先設定的規則,如不符合則發告警通知。
  • Windows工作排程監控:使用者可監控目標伺服器的Windows工作排程,監控是否有為停用的狀態及最近一次的執行狀況是否為異常,若為停用或異常則發告警通知。
  • Windows效能監控(進階版):使用者可監控目標伺服器上的項效能指標,可自訂受監控的物件(Category)、例項(Instance)與計數器(Counter),當監控結果不符合使用者的成功條件時就發告警。
  • Windows事件檢視器監控(進階版):使用者可針對目標伺服器上事件檢視器(EventLog)的特定事件進行監控,包含Windows記錄與應用程式及服務記錄檔皆涵蓋在內,當發現有錯誤的事件發生時,就發出告警。
  • ODBC DSN連線監控:使用者可監控目標伺服器(Windows)ODBC資料來源管理員中所設定的資料來源,當無法連線時發出告警,若有設定資料庫指令與告警臨界值,則會連線該資料來源資料庫並執行該指令,當回覆時間超過告警臨界值時發出告警。
  • Windows檔案存在時間監控:使用者可針對目標伺服器上檔案資料夾進行監控,當符合篩選條件的檔案建立日期、修改日期或存取日期,其中建立日期、修改日期或存取日期由使用者於新增監控時設定,超過所設定的告警臨界值時,就發出告警。
  • Web Post監控:依照輸入的URL,透過Http Post方式發送Request的方式,並接收目標網站回送的Response。 使用者可自訂義成功條件,系統會用來判斷Response是否符合成功條件。
  • Ceph OSD Daemon監控:使用者可監控目標伺服器(Linux)上Ceph OSD Daemon的狀態,當狀態異常時發出告警。
  • SNMP 硬碟大小監控:使用者可透過簡單網路管理協議(Simple Network Management Protocol)監控指定的目標伺服器上特定磁碟的剩餘空間,查看該空間的剩餘量是否低於告警臨界值,如低於告警臨界值就發出告警。
  • SNMP 效能監控:使用者可透過簡單網路管理協議(Simple Network Management Protocol)監控目標伺服器上的CPU和Memory兩項效能指標,當超過告警臨界值時就發告警。
  • SNMP 網路流量監控:使用者可透過簡單網路管理協議(Simple Network Management Protocol)監控目標伺服器上特定網路介面流量,當網路輸入或輸入流量超過告警臨界值時就發告警。
  • IPMI 感測器監控:使用者可透過智慧平台管理介面(Intelligent Platform Management Interface)監控目標伺服器上的硬碟感測器和電源供應器感測器,當監控執行當下所得到的感測器結果與設定當時的感測器結果不同時視為異常,當異常發生時會發送告警。
  • IPMI OS Boot監控:使用者可透過智慧平台管理介面(Intelligent Platform Management Interface)監控目標伺服器上OS Boot事件,當監控時間間隔內有OS Boot事件時就會發送告警。
  • Zabbix告警監控:整合一款監控軟體Zabbix,可依照使用者所輸入的Zabbix主機與權限抓取Zabbix所觸發的告警資訊,透過NIMBUS Watch將告警訊息即時發送至使用者行動裝置中。
  • MySQL連線監控:使用者可監控指定的資料庫查看資料庫是否正常運行,除了會嘗試登入資料庫,還會進行查詢作業,確保該資料庫是真的在正常運行。
  • MySQL資料鎖定監控:使用者可監控MySQL伺服器資料庫是否有資料鎖定(Lock)的狀況並設定臨界值,當鎖定時間超過臨界值則發告警通知。
  • MySQL工作排程監控:使用者可監控目標MySQL伺服器的Event是否為停用狀態,如為停用則發告警通知。
  • MySQL狀態監控:使用者可監控目標MySQL伺服器的狀態是否符合告警臨界值,狀態包括最大連線佔比、拒絕連線佔比、目前連線佔比InnoDB快取命中率Thread快取命中率、鎖定連線數、InnoDB redo logs佔比、全表掃描佔比與暫存表佔比等九項指標,當發生不符合告警臨界值時則發送告警。
  • SMTP監控:透過Telnet指令進行郵件發送測試,可透過設定不要實際發送郵件,以避免電子郵件的堆積,透過SMTP伺服器所回應的結果判斷是否正常,當異常發生時會發送告警。
  • Grafana告警監控:Grafana是一套開源的監控及分析平台軟體,NIMBUS Watch可透過Grafana 所提供的API取得Grafana上的告警訊息,透過NIMBUS Watch進行告警通知。
  • cAdvisor監控:cAdvisor為Google開源的基礎設施監控工具,透過在Docker主機運行以監控容器的效能,NIMBUS Watch定期取得監控目標的效能,當超過臨界值,則以推播告警通知。
  • 自定義推播訊息(資料庫)監控:使用者可自行輸入查詢指令,輸入的查詢指令所回傳的結果皆會當成需推播的資訊,回傳的結果需包含兩個以上的欄位,第一個欄位會被當成推播訊息的標題,第二個欄位會被當成推播訊息的內容,可依照使用者的需求自行輸入指令,倘若筆數過多時將只針對前十筆發送告警。可支援的資料庫連線方式包含SQL Server、MySQL與Oracle三種。
  • 自定義推播訊息(ODBC)監控:使用者可自行輸入查詢指令,輸入的查詢指令所回傳的結果皆會當成需推播的資訊,回傳的結果需包含兩個以上的欄位,第一個欄位會被當成推播訊息的標題,第二個欄位會被當成推播訊息的內容,可依照使用者的需求自行輸入指令,倘若筆數過多時將只針對前十筆發送告警。可支援的資料庫連線方式為ODBC。
  • 自定義推播訊息(文字檔)監控:使用者可自行輸入資料夾路徑,當資料夾路徑內包含文字檔時,檔案抓取區間以上次監控執行時間至本次監控執行時間為限,時間以檔案修改時間為準,抓取到的檔案皆會當成需推播的資訊,監控時會將欲告警的檔案複製到監控模組伺服器中,以供前端觀看。監控告警時檔名為標題,內容提供一網址可連至網址觀看內容,僅支援副檔名為txt的檔案且檔案大小須小於1MB,倘若超過1MB則不予處理,檔案過多時將處理最近十筆,避免告警數量過多。
  • 自定義推播訊息(電子郵件)監控:使用者可自行輸入電子郵件相關資訊,NIMBUS Watch將會依照篩選條件讀取信件內容,並將信件主旨作為告警標題,將信件內容作為告警內容,倘若監控間隔區間內抓取信件數量超過十筆時將僅發送十筆,避免告警數量過多,信件若具有隱私性請注意告警發送對象是否設定正確。
  • 網頁測試監控:NIMBUS Watch可執行Selenium所錄製的腳本,當網頁測試結果有錯誤時視為異常,當異常時系統會發送告警。目前網頁測試監控只支援執行Chrome測試Python語法的Selenium腳本。在監控前,請先錄製Selenium腳本,並在測試機器上用Python執行Selenium腳本測試。
  • Oracle 連線監控:使用者可監控指定的資料庫查看資料庫是否正常運行,除了會嘗試登入資料庫,還會進行查詢作業,確保該資料庫是真的在正常運行。
  • Oracle Datafiles 監控:使用者可監控指定的Datafile,NIMBUS Watch提供包括平均讀取時間(ms)、平均寫入時間(ms)與狀態三種監控內容,當平均讀寫時間超過臨界值或狀態為offline則發告警通知。
  • Oracle Tablespace 監控:使用者可監控指定的Tablespace,NIMBUS Watch提供包括剩餘空間(MB)、剩餘空間(%)與狀態三種監控內容,當剩餘空間低於臨界值或狀態為offline則發告警通知。
  • Oracle 工作排程監控:使用者可監控指定的工作排程,是否為停用及監控區間內執行結果是否為異常,如有上述狀況則發告警通知。
  • Oracle 資料鎖定監控:使用者可監控資料庫是否有資料鎖定(Lock)的狀況並設定臨界值,當鎖定時間超過臨界值則發告警通知。
  • 執行Oracle指令監控:使用者可監控目標資料庫,透過輸入指令判斷回傳筆數是否符合預先設定的規則,如不符合則發告警通知。
  • UNC路徑連線監控:使用者可透過此監控測試該UNC路徑連線是否正常,如無法連線則發送告警通知。
 

隨時隨地掌握狀況,及時處理

  • 雙APP設計:公有雲及私有雲雙版本,符合各種類型的需求。
  • 兩類登入機制:公有雲整合Facebook、google、CAMP與Weibo帳號,涵蓋最熱門的登入機制。私有雲版可透過本機帳號或AD帳號登入,本機帳號以安裝私有監控模組主機的本機帳號為主,只要可以登入該台主機的本機帳號,即可登入NIMBUS Watch私有雲版;AD帳號整合企業內AD Domain的認證方式,無須額外維護人員名單,直接與AD帳號整合。
  • 四十六種監控項目:涵蓋基本監控模組、SQL Server 2014監控模組、Windows Server 2012R2監控模組、MySQL監控模組、Container監控模組、進階監控模組與Oracle監控模組。
  • 彈性的監控規則設定:可依需要自行設定監控規則,24小時不間斷。
  • 彈性的告警規則設定:目前已經提供Email及訊息推播的機制,未來將再提供電話撥打的通知方式。
  • 便利的設定方式:透過行動裝置即可操作,雖時隨地掌握監控狀況。
  • 自訂參數設定:私有雲版可以依照監控的規模自行調整各項監控參數。
 

 

導入後效益

  • 低成本、立即安裝立即使用。
  • 隨時掌握狀況即時處理。
  • 縮短問題處理時間。
  • 自動化處理(Windows Services/IIS Application Pool 可以設定自動啟動)。
  • 將人力及時間運用在更有貢獻與生產力的工作上。
  • 針對SQL Server連線、交易記錄檔、工作排程與資料鎖定,達成全面性的資料庫監控。
  • 監控主機效能、硬碟大小與工作,防止主機突發異常導致服務中斷。