現今,以 Kubernetes 等容器技術為底座的云原生架構已成為廣泛流行的新一代企業 IT 基礎設施。在互聯網、金融、制造等關鍵行業,越來越多的云原生業務應用在生產環境中運行。
隨著客戶業務的發展,Kubernetes 集群個數和規模不斷擴大,集群狀態每時每刻都在發生變化,各個組件也在不斷的進行更新和升級,CPU 異常、內核死鎖、容器運行時守護程序無響應、Etcd 健康狀況異常等各種難題讓集群管理員叫苦不迭。
青云科技于近期正式發布 Kubernetes 集群巡檢 SaaS 服務,完美解決集群管理員的苦惱,旨在通過定時或周期性檢查 Kubernetes 多云環境中的集群節點、組件等配置是否符合最佳實踐,以幫助用戶及時發現集群組件、服務、端口中的容器漏洞和暴露(CVE),分析 Kubernetes 中的運行風險,并推送報告,從而保證業務持續穩定運行,盡早地降低企業風險。
集群巡檢 SaaS 服務的發布,進一步豐富了 KubeSphere Cloud 云原生應用服務體系,與云原生備份容災服務、輕量集群服務共同加速企業云原生轉型。
集四大特性于一體,保證集群健康安全穩定
相較于基于白盒監控集群數據的傳統巡檢方式,集群巡檢 SaaS 服務能夠一鍵診斷 Kubernetes 集群健康狀況,并具有四個顯著特性:
• 跨云統一管理 Kubernetes 集群
支持一個統一平面管理任何云上的 Kubernetes 集群,對所有巡檢結果進行集中監測,并配置定時巡檢,讓用戶對集群、節點、應用的健康狀態可以隨時掌控。
集中監測集群健康狀態
• 全面滿足業務級健康檢查需求
能夠全面滿足集群控制平面、節點的問題檢測等業務級需求,包括 Kube-APIServer、Etcd、Kube-Controller-Manager 等核心組件、CPU 利用率、Memory 與 Disk 壓力,以及驗證 Yaml 規范等。
查看風險項及修復建議
• 定期檢查集群存在的風險預警
支持定時(按小時、按天、按周、按月)對集群的節點和服務進行健康檢查并生成巡檢報告,以便周期性掌握集群健康情況,及時對異常或風險點進行處理。默認支持 28 個巡檢項。
啟用定時巡檢,生成巡檢報告
• 提供巡檢結果的可視化展示與報告
支持一鍵評估集群健康分數,巡檢結果圖形化展示,支持巡檢報告導出與周期性郵件總結,一目了然,極大便利用戶觀察、監測集群安全狀態,提前發現風險,盡早介入問題,完成配置變更。
風險時序圖
面向四大應用場景,保證業務持續穩定運行
對于集群管理員或開發人員而言,集群巡檢 SaaS 服務都可以帶來極大幫助,在放心使用 Kubernetes 的同時,減少人工檢查和定位各種疑難雜癥的工作量,提高工作效率,主要體現在四大應用場景:
• 日常運維排查
通過集群巡檢 SaaS 服務,能夠幫助用戶消除 Kubernetes 集群日常運行中的安全漏洞和盲點,助力 DevSecOps 機制形成,確保 Kubernetes 上云原生業務應用持續可用,保障業務連續性。
• 安全合規審計
遇項目驗收需第三方評測機構安全合規審計時,可通過集群巡檢 SaaS 服務預先檢測容器漏洞、安全配置與應用合規性,規避合規審計紕漏,盡早降低安全風險。
• 客戶環境掃描與報告
基于集群巡檢 SaaS 服務,能夠定時、定向對用戶 Kubernetes 集群或鏈路進行掃描,如 Etcd 冷熱備多集群覆蓋、風控配置、限流配置等,并周期性推送郵件報告,針對風險提供修復建議等。
• 資源成本優化
通過集群巡檢 SaaS 服務,用戶能夠盡早了解業務中各資源消耗的情況,以便動態調整使用配置,優化 Kubernetes 成本,提升計算資源效能,助力降本增效。
為便于用戶盡快體驗使用,集群巡檢 SaaS 服務發布之際,推出“標準版”30天免費試用,用戶可享受每月 50 次集群保護數、多至 3 個集群同時巡檢、巡檢報告可留存 30 天,以及體驗巡檢報告導出、郵件報告訂閱、定時巡檢等功能。