金融信創是金融機構重點投入以及技術迭代的方向,經過多年階段迭代,進入難度更大的核心系統、關鍵業務系統的更替階段。近日,云杉網絡憑借其在云原生可觀測性領域的深厚積累,正式發布了DeepFlow金融銀行業可觀測性方案及服務,解決行業中普遍存在的分布式交易系統保障難、平臺雙軌多芯調優難、云上資源把控難、分布式數據庫追蹤難等挑戰。方案基于DeepFlow可觀測性平臺以及總結金融客戶發展特點,注重產品與服務結合,貼合不同客戶建設發展階段,深入落地觀測場景,為客戶提供完備的、值得信任的可觀測建設路徑。
方案價值
云建設及試運行階段
不僅僅聽云服務商的說法
在驗證平臺運行是否符合需求及預期過程中,DeepFlow最大的價值是獨立、客觀地支撐客戶進行驗證及優化平臺,提供客觀全棧運行數據,獨立于云服務商進行性能評估及數據說明,尤其在網絡路徑、拓撲呈現、鏈路追蹤、資源匯總時提供比對依據。
核心系統開發及調試階段
提升非功能測試效率
優化交易響應時間是非功能測試中重要的目標,通常銀行交易業務每筆交易需要在60-80ms中處理完成,每筆交易響應過程,需要經過多個微服務調用,涉及業務單元、公共服務、網絡傳輸、負載均衡等。DeepFlow輕松串起每筆交易的調用追蹤,并能有效關聯至網絡、資源、日志等維度數據,是每個開發調試人員向往的理想環境,以快速定位性能瓶頸的調用、資源等,快速發揮工程師的優化手藝。
信創數據庫、信創處理器、信創系統等環境中,對于測試交易過程中,建立統一性能看板,詳細記錄從函數粒度占用CPU、到調用請求處理延時的性能數據,本質上改觀分布式系統適配、評估平臺,路線選型的效率瓶頸。
關鍵業務應用上線階段
明察上線不同環境后的性能差異
通常關鍵業務上線是行里的重要事件,涉及開發中心、數據中心以及各服務商多部門協作。在上線階段,人員都是各領域的專家,雖然開發環境、測試環境、試運行環境都是盡可能地統一規格進行建設,但經過使用運行,仍然存在不可避免的差別,導致上線系統在功能、性能上達不到預期。雖然多部門的專家都待命,但通常解決問題并不是很順暢且多有反復。當試運行環境具備觀測能力后,對于運行狀態、測試交易進行實時記錄,每個團隊都有統一的數據視角,各技術棧專家,開發工程師可以快速獲取上下文,鎖定問題范圍,專業的工程師都能在自身技術棧的范圍內充分發揮作用,大大提升判斷瓶頸、復現問題、修復補丁、驗證測試等不同環節中的協作效率。
業務應用生產運行階段
分鐘級定界故障
系統正式上線生產環境后,進入生產運維保障側后就是保障業務連續性。經過了大量嚴謹的測試和上線流程約束后,不會出現重大功能性故障。但既然是系統,由于外界、內部的因素,總不能保證100%穩定服務。大部分客戶都是使用工單,進行運維側處理各類運維故障的手段流程。避免工單無止盡地在部門間流轉,分鐘級定界問題,呈現可信的多維度觀測數據,降低MTTR(Mean Time To Repair,平均修復時間)。
運維智能化階段
不再是人工的智能
運維經驗以及多技術棧的廣度和深度,束縛著運維效率的提升。DeepFlow Agent、Server組件低代價完成收集及沉淀觀測數據,并進行標記、關聯及語義化編碼。觀測數據結合大模型后,即可使用DeepFlow智能體,將以上不同場景的數據分析工作,轉移至群聊中的助理機器人、工單派送中的分發機器人、排障過程中的根因機器人,總結過程中的報表機器人來進行,提升運維質量及效率。
面向不同發展階段的金融行業客戶,”觀測工具服務””觀測數據服務““觀測底座服務“以及”觀測智能體服務”為客戶持續輸出從具體定界排障到智能化場景落地的能力。