“收錄全網應用商店資源,找應用玩游戲?一個豌豆莢就夠了!”——這是人氣移動內容搜索平臺豌豆莢的廣告語。通過“應用內搜索”技術可以搜索到千萬量級的不重復應用、游戲、視頻、電子書、主題、電影票、問答、旅游等內容,對于智能手機用戶而言,非常之便捷。
從2009年工程師寫下第一段代碼發展到現在,豌豆莢的注冊用戶已經超過了4.2億,服務器和響應的應用服務數量也隨之快速的增長。用戶和業務的增長帶來欣喜的同時也給豌豆莢的IT運維人員帶來了不小的壓力。人為管理失誤在所難免,嚴重影響工作效率。

業務增長喜憂參半 運維監控挑戰多
為了讓資產管理和運維工作實現自動化和智能化,將運維和技術支持人員從繁重的人工作業中解脫出來,豌豆莢從2013年6月開始梳理自身監控系統需要解決的問題,并積極尋找監控解決方案。
豌豆莢IT部門總結,在監控系統方面,以下問題亟待解決:
服務器和應用服務一部分可以通過外網訪問,大部分是在內網環境,需要能夠在內網進行監控;
自動化的監控管理,監控的服務器和應用服務數量上千計,希望監控能夠與資產管理系統進行對接,實現服務器服務發生變化的時候監控能夠自動適應改變;
內部人員各有分工,需要比較好的用戶管理和權限管理支持,保證統一認證。
IT監控有利器 APM來幫忙
豌豆莢也曾經想過在監控軟件方面進行自行開發,可是開發需要新的人員的投入,后期維護方面也頗為頭疼。隨著互聯網的興起,國內APM(應用性能管理)服務也在逐漸成熟,這可是運維人員的福音。

早期的APM主要應用于網站監控和網頁監控。APM可以實現二到七層網絡的可視化,讓運維人員了解網絡的流量和應用構成、網絡中包的大小和分布以及網絡層協議流量等。網頁方面,頁面性能指數、頁面響應時間和可用率等都可以盡在掌握。
隨著技術的發展,APM可以實現對服務器中的CPU、內存和磁盤等硬件性能的監控,這也正滿足了豌豆莢的需求。除此之外,APM還可以對API進行監控,可以跨多個平臺,監控范圍從API和數據支撐層,到剖析應用接口的可用率和正確性;保障API數據服務和業務的完整、有效和一致。
云智慧監控寶讓豌豆莢如愿以償
確定了方向,豌豆莢便開始了APM的產品的采購選型。2013年7月,豌豆莢確定使用在互聯網企業中頗有口碑的“監控寶”。
“監控寶”是云智慧推出的APM產品,能夠監測從用戶發起請求到任務完成的全過程,包含了針對應用、網站、業務流程、服務器、服務和數據庫的監控,同時還可以實現對網頁性能的管理,并提供實時告警,被用戶譽為端到端IT性能監控神器。

豌豆莢選定了監控寶企業版,并與云智慧技術支持人員一起確定了實施方案:
首先,豌豆莢對原有的網站監控項目導入到新版本中維持不變。服務器和服務性能監控通過插件的方式進行內網數據采集和監控,多個插件的數據匯總后提交到監控寶的中心服務器,解決了通過外部網絡無法獲取內網數據的問題。所有的服務器性能和服務都通過這種方式統一在內網監控。
在系統集成方面,監控寶提供企業版API V2版本,支持產品之間的對接,實現由資產管理系統驅動來完成監控項目的創建、修改、移除以及告警設置的變更,全過程自動化處理,不需要人工干預。
最后,在用戶和權限管理方面,實現了統一的安全認證,將所有企業用戶納入到企業版中,配置權限,統一管理。
監控寶系統上線后的幾天時間,豌豆莢幾百臺服務器的監控都建立起來。監控寶提供的全面API與豌豆莢的內部系統接合,很好的解決了自動化運維的需求;靈活的報警策略也能讓IT運維人員第一時間發現故障,并通過監控寶提供的多樣的視圖組合快速找出故障原因。

經過一段時間的穩定運行后,豌豆莢又增加了監控服務器的數量,總計有上千臺的服務器在監控寶的監控下運行。系統監控運維真正實現了自動化和智能化,提高效率的同時,節省了運維成本,運維人員也可以將精力用于更有價值的事情。
豌豆莢表示,企業正處在快速發展的過程中,業務和服務器數量的激增需要自動化的監控管理和清晰的故障診斷視圖。監控寶實現了IT系統的可視化和運維監控的智能化,為以IT為核心的互聯網企業提供了非常高效、有價值的運維解決方案。