本次直播的主要內容是介紹監控易一體化監控平臺的兩個主要功能:設備監控納管和故障告警。監控易平臺是一個綜合性的監控管理工具,可以對IT基礎監控設備和物聯網設備進行統一的監控納管。通過使用監控易,用戶可以方便地監測設備的狀態和數據,并即時收到針對設備故障和異常情況的告警通知。如果您錯過了本次直播,可以搜索視頻號:監控易,觀看直播回放,了解更多關于監控易平臺的功能和使用方法。
首先,我們需要登錄到統一監控平臺。在功能菜單的左側,有一個 “綜合監控”選項,用于管理監控平臺的納管功能。在該模塊中,我們可以輸入、查看和配置與監控相關的信息。
監控易術語及概要介紹
我們將介紹一些常用的監控平臺術語,以幫助用戶更好地理解和使用監控平臺。
監控方式:我們將說明監控是通過什么方式和連接形式進行的,以便用戶更清楚地了解監控的實現方式。
監控設備配置:我們將簡要介紹監控設備的配置,包括基本配置項和設置方法,以及如何對設備進行監控和管理。
設備指標和展示:我們將介紹設備的指標和展示信息,這些指標和信息可以幫助用戶更全面、直觀地了解設備的運行狀態。
接下來,我們將介紹告警中心。告警中心是用于告警發送和配置的功能模塊。我們將通過以下兩個點來介紹告警中心的使用:
告警中心配置:我們將詳細介紹如何設置告警規則和條件,并將這些規則與設備的監控數據進行關聯。
告警方式:我們將介紹不同的告警方式,如短信、郵件、電話等,并詳細介紹如何配置和管理這些告警方式。
此外,我們還將討論告警的優先級設置和處理方式,以便更好地應對不同級別的告警事件,并及時采取相應的措施進行處理。
通過本次直播,我們希望能讓大家更深入地了解一體化監控平臺的功能和使用方法,以便更好地應對和管理監控和告警事務。如果在介紹過程中有任何問題,請隨時在聊天窗口提問,我們會盡力解答。謝謝大家!
告警中心是一種集中推送告警信息的平臺,以下是對告警中心的介紹:
管理對象:管理對象是指IT平臺中的軟件或硬件實體,如服務器、操作系統、網絡、數據庫、中間件等。這些管理對象是需要進行監管和監控的對象。
監測點:監測點是指管理對象下的特定監測點,它包含了有關CPU、內存、磁盤等監測項內容。監測點用于提供監測對象的具體信息。
監測指標:監測指標是指監測點內的詳細信息,用于細化監測點的狀態。例如,對于監測點"CPU",監測指標可以包括CPU使用率、CPU溫度等。
組:組類似于Windows中的文件夾,用于管理和組織設備和監測對象。用戶可以在組中添加設備和監測點。
監測點依賴:監測點依賴是一種規則或策略,用于控制告警信息的展示,避免告警信息泛濫。用戶可以設置告警依賴規則,使得只有關聯的監測點異常時才會觸發告警。
通過綜合監控設備納管的位置功能信息,用戶可以實現對管理對象的監管和監控,同時利用告警中心的功能來推送準確且及時的告警信息,以保障系統的正常運行和安全性。
故障狀態:指設備或監測點出現故障或異常的狀態。
依賴監測:根據故障狀態去檢測所依賴的點,如果滿足設定的依賴條件,則觸發自動停止禁止的狀態。
告警:監控平臺根據設定的告警條件觸發告警信息,并通過相應的告警方式向用戶發送告警信息。
計劃任務:監控平臺內的時間安排,用于輪詢監測和告警的執行時間??梢酝ㄟ^后臺配置設置任務時間,例如每周7天2次。
禁止:通過手動或計劃任務的方式,在監控平臺內對組、監測對象和監測點進行禁止操作。禁止后,設備或監測點呈現黑色狀態,并停止監測。
允許:在設備禁止狀態下,通過操作按鈕點擊允許,使設備恢復監測狀態。狀態也會根據允許后的監測返回數據進行變化,恢復到正常狀態。
綜上所述,我們的平臺內共有6種監測狀態,分別為未知、正常、警告、故障、禁止等狀態。每種狀態對應的顏色如下:
未知狀態:灰色
正常狀態:綠色
警告狀態:黃色
故障狀態:紅色
禁止狀態:黑色
在告警事件中,我們會推送日志消息,并提供告警事件的詳細信息,包括告警錯誤重試次數。我們提供了設置告警重試次數的功能,可以根據網絡抖動或不穩定的情況來避免因不穩定導致的故障推送和顯示。告警錯誤重試頻率默認為監測頻率的5秒。如果需要調整監測頻率的時間間隔,可以通過設置錯誤頻率來觸發相應的錯誤重試輪詢時間間隔。
在添加設備或監測對象時,可以設置設備的標識性名稱作為標題。閾值是通過配置設備和添加監測點來設置的,用于確定危險或故障的閾值。當前設備的狀態會根據匹配的危險或故障閾值進行判斷。
添加設備監控
當我們登錄到平臺后,在頁面的左側,有一個樹形結構,用于展示設備的組分類和標簽。這些主要信息可以根據不同的應用場景進行添加和展示。它們能夠幫助我們快速定位和管理需要監控的設備,并設置需要查看的信息,方便我們進行后續的運維工作。
分類方式是指通過不同的設備類型進行分組管理和展示。可以根據設備的不同特性來進行分類,以便更好地組織和管理設備。
標簽方式是指針對設備可以打上多個標簽,通過這些標簽可以快速定位到具有相同標簽的設備。這樣可以方便地查看和應用這些設備的信息。
在頁面的中間位置,我們可以看到一個監測列表。這個列表包括設備的狀態信息,設備列表,監測點列表和視圖列表。這些列表以表格的形式展現,方便查看設備的監測情況。
在頁面的右側,我們可以看到添加設備的相關信息。我們可以手動添加單個設備,也可以通過批量添加的方式一次性添加多個設備。此外,頁面右上角還有一個搜索框,可以通過關鍵詞快速搜索設備信息。
在設備列表下面,我們可以看到監測點列表。對于每個設備,我們可以設置多個監測點,以監測不同的指標或參數。每個監測點都具有對應的狀態信息和監測結果。
最后,頁面的底部是視圖列表。我們可以根據需要自定義不同的視圖,并將設備或監測點添加到這些視圖中。這樣可以更方便地查看和管理相關信息。
通過綜合監控頁面,我們能夠快速瀏覽和查看設備的狀態信息,并設置相應的告警規則。當設備出現危險或故障狀態時,系統會自動發送告警通知,以便及時處理和維修。這種監控方式能夠實現對設備的全面監測和管理,提高設備的可靠性和工作效率。
添加監控的方法主要有以下幾種:
1. 使用插件:對于服務器操作系統的監控,可以通過安裝插件的方式進行監控。在被監測的服務器上安裝對應的應用插件,然后監控系統將通過插件與被監測的服務器建立連接,并獲取服務器的資源信息。
2. 使用連接協議:對于服務器操作系統和應用中間件的監控,可以通過不同的連接協議進行監控。比如使用WMIS、PSSH、SMB等連接協議,通過連接被監測的服務器或數據庫進行監控和信息獲取。
3. 使用硬件管理協議:對于服務器硬件的監控,可以通過IPMI(Intelligent Platform Management Interface)或SNMP等硬件管理協議連接服務器的管理口,獲取風扇、電源等硬件信息的資源監控。
4. 使用遠程連接或協議:對于數據庫和中間件的監控,可以通過遠程連接或特定的協議進行監控。比如使用遠程連接或ODBC等多種方式連接數據庫,獲取數據庫的性能指標和運行狀態。
5. 使用Agent:通過在被監控設備上安裝Agent程序,可以實現對設備的監控。Agent會收集設備的各種信息,并將信息發送到監控系統進行分析和處理。在監控系統中配置Agent的連接信息和監控項,即可實現對設備的監控。
在添加監控時,需要配置設備的連接信息、并選擇需要監控的項,如CPU、內存、磁盤、網絡等,設置相應的閾值和告警規則,以便在超出閾值時及時發出告警通知。
綜上所述,通過安裝插件、使用連接協議、配置Agent等方式,可以實現對不同類型設備的監控。根據設備的類型和需求,選擇適合的方法進行配置和管理。
以下是不同方面監控方法的總結:
業務網絡監控:通過SNMP等方式獲取業務網絡的屬性信息,添加錄入并設置指標進行監控。
網絡設備監控:使用已適配的模板,選擇網絡設備并錄入信息進行監控??赏ㄟ^驅動連接或SNMP方式進行數據采集。
存儲監控:一般使用驅動連接或SNMP方式采集存儲設備的數據,并進行監控。
虛擬化監控:通過API、WMI等方式連接虛擬化設備,獲取數據進行監控。
物聯網監控:分為兩種方式:a) 使用SNMP網絡協議,通過網絡設備獲取被監測的IoT設備數據信息進行監控納管;b) 使用窗口協議,動環類設備通過窗口協議發送監測信息,轉換為TCP協議,通過Modbus等進行監控。
總之,根據不同方面和需求,可以選擇合適的監控方式和協議進行數據采集和監控。
在添加設備時,我們提供了模板的方式來更方便地進行配置。您可以在模板中選擇與您設備相匹配的配置,或自定義添加設備的配置信息。
對于新的設備型號或品牌,我們會進行適配和實現,以確保您可以在平臺上進行監控和管理。通過持續的迭代更新,我們將保持平臺的易用性和功能完整性。
如果您還有其他關于設備配置和添加的問題,請隨時與我們溝通。我們將竭誠為您提供支持和幫助。
服務器監控的配置可以根據具體設備的配置和廠家提供的標準手冊進行匹配。
綜上所述,無論是服務器類型還是網絡類型,都可以通過對應的連接配置進行平臺的納管和監控。
設備監控和設備運維
在監控納管之后,展示的效果取決于監控的指標。主要分為幾個類型,包括服務器應用和業務網絡設備、安全存儲、虛擬化、物聯網以及其他虛擬設備。
對于服務器,我們可以在平臺的概覽信息中查看資源信息的整體趨勢,方便使用和維護時定位問題的原因。例如,當CPU超過設置的閾值時,可通過監控平臺及時發現并進行相應處理。
對于業務網絡設備,可以監測設備的運行狀態、帶寬使用情況和網絡延遲等指標,以便及時發現和解決網絡故障。
安全存儲方面,可以監測存儲空間的使用情況、讀寫速度和數據備份情況,確保數據的安全和可靠。
虛擬化和物聯網設備方面,可以監測虛擬機的運行狀態、資源利用率和傳感器數據等指標,以優化資源配置和提供智能化服務。
通過匯總和展示這些監測指標,監控平臺能夠提供整體情況的概覽,并提供細節信息來定位問題的原因。這有助于提高系統的穩定性和性能,并降低故障發生的概率和影響。
監控狀態和監控數據在服務器類型上體現為,可以提供概覽信息和監控情況,包括資源監測、異常監控和監控數據。通過這些信息,用戶可以及時了解服務器的運行狀態和問題情況。
在網絡設備上,監控狀態和監控數據主要通過資源信息和流量信息展示和體現。如果出現接口down或流量超出閾值的情況,系統可以進行預警和提醒,同時根據問題的嚴重程度進行顏色狀態的變化顯示,如黃色危險和紅色故障。
對于安全防火墻,通過SNMP連接獲取相關信息,并展示和體現用戶關注的數據??梢酝ㄟ^圖表等方式展示安全防火墻的使用狀態,是否可用以及資源使用情況。
對于存儲類型,監控狀態和監控數據的體現方式與其他類型類似。可以通過展示存儲的當前使用狀態和資源使用情況,以及提供視圖和狀態的展現,方便用戶了解存儲環境的運行情況。
對于虛擬化環境,監控狀態和監控數據可以展示各種虛擬化類型的使用狀態、可用性和資源使用情況。通過視圖和狀態的展現,用戶可以清楚地了解和監控虛擬化環境,幫助優化性能、排查故障,并確保環境穩定可靠。
綜上所述,監控狀態和監控數據統一體現在各個類型的服務器、應用、網絡設備、安全防火墻、存儲和虛擬化環境中,以展示圖表和視圖等方式提供全面的監控信息,幫助用戶實時了解系統運行情況,并進行性能優化和故障排查。
物聯網監控的一體化監控平臺,涵蓋了基礎監控設備和物聯網設備的監控納管?;A監控設備包括UPS、溫濕度、水浸空調等動態設備,其監控信息可以統一展示在監控平臺上,實現對監控指標的展示。此外,還可以對PING和端口進行統一監控和展示,包括設備管理內的監控平臺信息納管,支持添加監控配置和展示功能。
告警中心是監控平臺中常用的功能,用于匹配監控設備的危險或故障狀態,并通過預設的策略規則進行告警。在告警設置中,可以新增告警策略,并通過資源組或設備類型的方式選擇需要發送告警的策略范圍,保證告警的準確性和及時性。同時,在告警策略中還設有屏蔽規則,用于防止頻繁發送告警信息,提高告警的可用性。
總之,該一體化監控平臺可以實現對基礎監控設備和物聯網設備的統一展示和監控納管,包括監控指標的展示、告警中心的設置和告警功能的實現。這樣可以確保設備的正常運行,并有效處理設備的危險或故障狀態。
設備故障告警
在告警設置中,我們還可以進行以下操作:
1. 告警頻率控制:可以設置一段時間內的最大告警次數,防止告警風暴的發生。
2. 告警通知跳過:可以設置某些特殊情況下的告警跳過發送,以避免無用的告警信息。
3. 告警恢復通知:可以設置在故障處理完成后發送一個恢復通知,以及通知的接收人和發送方式。
4. 告警提醒模板:可以設置不同級別的告警對應的提醒模板,包括郵件模板、微信模板等。
5. 告警日志記錄:系統會記錄每一次告警,包括告警類型、級別、發送時間等,方便查閱和分析。
6. 告警策略管理:可以對已配置的告警策略進行修改、刪除或添加新的策略。
通過上述的設置和配置,我們可以靈活地管理告警發送,包括設置告警級別、告警頻率控制、告警通知方式、告警恢復通知等,確保及時準確地將故障或危險情況通知到相關人員,同時避免告警風暴的發生。
收件和發件信息的策略,可以在告警策略中進行配置。在我們的平臺內,有一個告警中心,您可以在其中查看和處理所有告警信息。這個告警中心提供了一個直觀的視圖展示,您可以清楚地看到是否有告警發生,以及告警的原因是什么。您可以在這里配置收發策略,并且對告警進行查看、處理和忽略等操作。
在告警中心中,您可以查看發送歷史和當前的告警情況。如果有告警發生,您可以快速了解到相關情況,并采取相應的措施。同時,我們的平臺還提供了故障定位功能,可以幫助您找到設備故障的原因,進一步進行排查和修復。
以上就是關于告警中心和告警信息的一些內容和功能介紹。如果您對這兩個功能有任何問題或需要進一步了解,歡迎您提出,我們一起討論。非常感謝大家的支持和參與!如果在后續過程中有任何問題或需求,請隨時聯系監控易官網,以獲取幫助。我們期待與大家繼續交流,并將根據大家的需求準備下一次的直播內容。謝謝大家!
下次直播預告
云平臺在監控和運維方面發揮著非常重要的作用。它可以幫助用戶實時監控云上的各項服務,包括服務器狀態、網絡流量、存儲空間等,以確保云平臺的穩定運行。同時,云平臺還提供了豐富的運維工具和功能,如日志分析、異常檢測、自動化運維等,以簡化運維流程,提升效率。用戶可以輕松地管理和維護云上的各項資源,及時發現和解決問題,提高運維效能。
接下來的“監控易”直播將于8月24日舉行,觀看平臺為視頻號和抖音。本次直播的主題將聚焦于多云架構平臺的監控運維,我們將分享多云架構的特點和挑戰,以及如何通過監控和運維手段來優化云平臺的性能和可靠性。熱烈歡迎大家關注和積極參與,感謝您的支持!