隨著ChatGPT引領的人工智能(AI)浪潮席卷全球,智算需求正以前所未有的速度增長,推動傳統數據中心(IDC)向AI數據中心(AIDC)轉型升級。據《算力基礎設施高質量發展行動計劃》預測,至2025年,我國算力規模將突破300 EFLOPS,其中智能算力占比將達到35%。
當前,國內IDC市場呈現出通用算力過剩而智能算力緊俏的局面。一方面,芯片短缺成為制約智算發展的關鍵因素;另一方面,摩爾定律逐漸失效,使得通過“粗暴”堆疊芯片來滿足智算需求成為當前較為可行的方案。然而,這一方案對數據中心的電容、制冷等系統提出了新的挑戰。
在IDC向AIDC的演進過程中,預制化、綠色化、智能化已成為推動產業發展的重要趨勢。以預制化為例,建設一座支持萬卡的數據中心,若從土建開始,通常需要12個月的交付周期,而在北方地區,由于存在凍土期,工期可能更長。然而,AI大模型的快速發展使得各行業對算力的需求急劇增加,對數據中心的建設速度提出了更高要求。
普洛斯中國高級副總裁、數據中心業務聯席總裁郭仁聲指出,當前用戶對數據中心交付周期的要求極高,希望盡快上線業務。因此,預制化、模塊化的建設方式成為滿足這一需求的有效途徑。預制化數據中心通過將制冷、變電站、供配電等功能模塊進行模塊化分解,在工廠進行標準化生產和測試,再拉到施工現場進行拼裝,從而實現了快速交付和高質量保障。
以普洛斯常熟東南數據中心為例,該數據中心總建筑面積15萬平方米,IT負載達120MW,可為超過30萬臺服務器提供設施和增值服務。項目采用了多系統預制化的方案,在7個月內就實現了改建項目一期的落地交付,而傳統方案通常需要接近一年的時間。預制化、模塊化的建設方式還有助于降低數據中心全生命周期的碳排放,推動數據中心整體的碳中和進程。
在算力與碳中和的雙重需求下,如何實現二者的平衡成為產業上下游企業共同面臨的課題。當前,絕大多數芯片廠商的GPU利用率都在30%以下,這不僅導致企業需要堆疊更多芯片以滿足需求,增加了投資成本,還造成了資源浪費。因此,提高GPU利用效率、算力資源利用效率成為業內亟待解決的問題。
在碳中和方面,數據中心作為高載能行業,在AI時代面臨著更大的挑戰。隨著單機柜功率的不斷上升,傳統的供配電系統和制冷系統已經難以滿足需求。因此,數據中心需要進行升級優化。在供配電系統方面,自建變電站以提升穩定性的數據中心越來越多,同時采用高壓直流供電方式以提高供電效率和穩定性。在制冷系統方面,液冷技術迎來了爆發式發展,成為智算中心的“標配”。
AI技術也在數據中心減排和運營管理中發揮著重要作用。通過數智化的手段提升數據中心運營管理效率和質量已成為當下數據中心的常規操作。普洛斯自主研發的GLP DCBASE智慧化運營管理系統具備AI預警能力,能夠結合國家氣象等信息提前調整機房供冷系統,實現節能降耗。同時,該系統還能對機房內部環境進行實時監控,通過算法計算出常態穩定值,提前預警并處理潛在隱患,提升運維效率和服務質量。
當前,國內IDC龍頭企業如世紀互聯、萬國數據、秦淮數據等也在紛紛嘗試通過AI技術實現智能化運營,以提升整體運營效率和服務質量,優化運維人員配置,控制數據中心整體運維成本。未來,隨著技術的不斷進步和應用的不斷深化,AI將在數據中心領域發揮更加重要的作用。