在未來的五年內(nèi),數(shù)字經(jīng)濟的發(fā)展將步入快車道。云計算作為數(shù)字經(jīng)濟的重要載體之一,也將迎來發(fā)展的黃金時代。
據(jù)中國信通院測算,2020年,我國數(shù)字經(jīng)濟規(guī)模達(dá)到39.2萬億元,占GDP比重為38.6%,同比增長9.6%。大量設(shè)備入網(wǎng)上云,海量數(shù)據(jù)毫秒級傳輸,更多行業(yè)和企業(yè)獲得數(shù)字升級的機遇……
高性能計算助力高質(zhì)量發(fā)展
隨著數(shù)字經(jīng)濟規(guī)模逐步擴大,以及大量設(shè)備入網(wǎng)上云,數(shù)據(jù)量呈現(xiàn)幾何倍數(shù)式增長,對算力的要求也越來越高。傳統(tǒng)的小型機、單一計算單元已經(jīng)不能滿足當(dāng)下對算力的要求。因此,整合多個處理器或在某集群中整合多個計算機共同處理計算任務(wù),已經(jīng)成為實現(xiàn)高算力的必經(jīng)之路。基于此,高性能計算的概念應(yīng)運而生。
高性能計算是實現(xiàn)數(shù)字經(jīng)濟高質(zhì)量發(fā)展的重要手段之一。在青云QingCloud( 股票代碼:688316) 云平臺&服務(wù)部高級總監(jiān)陳海泉看來,現(xiàn)階段高性能計算應(yīng)用領(lǐng)域很廣闊,但最核心的用途是用來模擬世界萬物,“宏觀上,可以用衛(wèi)星圖像、遙感數(shù)據(jù)、氣象數(shù)據(jù)利用高性能計算來模擬地球、海洋和氣侯;微觀上,能模擬分子原子來了解生命的原理,使藥物的研發(fā)更快速、更精確。”陳海泉指出。
陳海泉表示,隨著高性能計算的發(fā)展,在更多的應(yīng)用場景得以應(yīng)用。大數(shù)據(jù)、人工智能與超算的融合就是其中之一。陳海泉將大數(shù)據(jù)和人工智能與超算的融合趨勢總結(jié)為三個表現(xiàn)方面:
首先,高性能計算與尖端科研密不可分,不斷提高的計算精度與更大規(guī)模的數(shù)據(jù)量的計算是推動科技進(jìn)步的動力;
其次,大數(shù)據(jù)的發(fā)展驅(qū)動存儲、算力的融合,“一方面,數(shù)據(jù)量不斷提升,另一方面,數(shù)據(jù)類型也越來越多樣化。這些數(shù)據(jù)都需要利用大數(shù)據(jù)進(jìn)行處理和分析。這一改變正在驅(qū)使數(shù)據(jù)中心和算力中心互相融合,并且數(shù)據(jù)量越大,對應(yīng)的算力也需要更強。”陳海泉強調(diào)。
再次,隨著人工智能的發(fā)展,機器學(xué)習(xí)、深度學(xué)習(xí)對算力的需求也越來越大,為了達(dá)到足夠的算力,就需要更多的GPU節(jié)點。
陳海泉表示,隨著大數(shù)據(jù)、人工智能與超算融合的場景越來越多,對超算提出了一定的挑戰(zhàn),在他看來,現(xiàn)階段,大數(shù)據(jù)的應(yīng)用主要面臨兩大挑戰(zhàn)。第一,存儲容量較原來大很多;第二,不同類型的業(yè)務(wù),對存儲的要求也不盡相同,“客戶既希望可以擁有無限的存儲容量,又希望能實現(xiàn)高性能計算,同時對成本有一定要求。這就需要超算中心針對不同業(yè)務(wù)提供合適的存儲類型。”陳海泉指出。
高性能計算的普及與推廣已是必然的趨勢,在這點上青云科技看得很“透”也很“遠(yuǎn)”,提早的產(chǎn)品及業(yè)務(wù)布局,也讓企業(yè)在實現(xiàn)高質(zhì)量發(fā)展的時候擁有充足的動能。
云3.0時代已來
談及“計算”就不能不說說云計算。上云作為絕大多數(shù)企業(yè)數(shù)字化轉(zhuǎn)型過程中的第一步,也是重要的一步。發(fā)展至今,企業(yè)對于“云”的態(tài)度已經(jīng)從“要不要上”轉(zhuǎn)變?yōu)?ldquo;如何上”,而云的形態(tài)及業(yè)務(wù)模式也從以資源為中心,傳統(tǒng)應(yīng)用云遷移時代,到以服務(wù)為中心,業(yè)務(wù)應(yīng)用依托PaaS云化的云2.0時代,再到現(xiàn)今的中心-區(qū)域-邊緣,全域分布的云原生時代。不同的時代,企業(yè)在數(shù)字化轉(zhuǎn)型過程中對云的需求也不盡相同。
伴隨著大數(shù)據(jù)、人工智能、5G等數(shù)字技術(shù)的發(fā)展,企業(yè)數(shù)據(jù)量越來越大,且在數(shù)字經(jīng)濟發(fā)展的當(dāng)下,企業(yè)對于數(shù)字資產(chǎn)的重視程度也愈發(fā)提升,分布式、云原生時代已到來。
IDC圈記者注意到,近日,針對超算、政企用戶,基于青云公有云IaaS平臺、PaaS平臺推出了QingCloud EHPC產(chǎn)品,主要為用戶提供公有云服務(wù),同時還可為部分用戶提供專屬云和混合云等多種形態(tài)豐富的業(yè)務(wù)服務(wù)。對此,青云QingCloud EHPC 產(chǎn)品經(jīng)理苗慧表示,青云為滿足客戶對高性能計算的需求,提供豐富多樣的使用模式,適配多種應(yīng)用場景,“通過統(tǒng)一管理的平臺,使青云工程師、研究人員可以突破本地的HPC基礎(chǔ)設(shè)施限制,在云上快速展開創(chuàng)新、研發(fā)。”苗慧強調(diào)。
據(jù)悉,青云QingCloud EHPC產(chǎn)品可提供云上超算SaaS化服務(wù),通過青云彈性公網(wǎng)IP、寬帶,進(jìn)行快速的數(shù)據(jù)上傳、下載與本地數(shù)據(jù)同步。
據(jù)悉,青云EHPC服務(wù)架構(gòu)主要由三層組成,分別是資源層、管理層,以及用戶端。
資源層主要包含青云的計算、存儲和網(wǎng)絡(luò)資源,以及相應(yīng)的后臺調(diào)度器、調(diào)度管理平臺以及可視化服務(wù)平臺。
管理層主要提供SaaS化的服務(wù),從開始作業(yè)到作業(yè)運行結(jié)束,系統(tǒng)將自動進(jìn)行折扣信息計算、計量計費和作業(yè)監(jiān)控服務(wù),能夠保證用戶進(jìn)來之后,對團隊項目、團隊項目權(quán)限等相應(yīng)的管理。
用戶端是用戶控制臺,用戶可以進(jìn)行創(chuàng)建集群、管理集群、彈性伸縮、作業(yè)提交、作業(yè)編排、作業(yè)性能分析。“通過用戶控制臺,用戶可以很方便地操作作業(yè)。”苗慧表示。
同時,在互聯(lián)網(wǎng)“唯快不破”的時代,云原生的應(yīng)用越來越多,越來越多的企業(yè)希望通過云原生的形式部署、運行業(yè)務(wù),這對以Slurm 調(diào)度器為主的超算中心來說是一個很大的挑戰(zhàn)。“QingCloud EHPC可以全面地支持各種新的業(yè)務(wù)場景,滿足客戶不同數(shù)據(jù)量、不同數(shù)據(jù)類型的業(yè)務(wù)需求。”陳海泉強調(diào)。
安全至關(guān)重要
對于所有數(shù)據(jù)中心而言,安全始終都是備受矚目的一點,這點對于超算中心來說也不例外。如何保障安全是超算中心運營過程中一個亟待解決的痛點。
現(xiàn)階段,傳統(tǒng)超算中心用戶在使用時,需要經(jīng)歷“提交申請—人工審批—安裝VPN客戶端—登錄”的流程,過程復(fù)雜,且超算中心登錄節(jié)點往往是多用戶共享一個節(jié)點。由于超算為了保證自身安全,不向客戶提供root權(quán)限,用戶安裝軟件還需出差至超算中心,在現(xiàn)場指導(dǎo)運維人員安裝,過程很麻煩;另一方面,Linux隔一段時間就會暴露出一些系統(tǒng)漏洞,如果被用戶利用得到root權(quán)限,則能竊取平臺上其他用戶的數(shù)據(jù),無法保障數(shù)據(jù)安全。
陳海泉表示,QingCloud EHPC平臺可有效解決上述超算中心運營痛點,“以云計算技術(shù)實現(xiàn)安全需求。”[王1] 陳海泉指出,具體在安全層面有三個改進(jìn):
第一,計算、網(wǎng)絡(luò)跟存儲的租戶隔離。因為云計算的虛擬化技術(shù),青云天然就把計算、網(wǎng)絡(luò)、存儲對于每個租戶在物理上及邏輯上做了很強的隔離。
第二,青云管理節(jié)點跟計算節(jié)點分離。租戶可以使用完全獨享的登錄節(jié)點,不必像以前那樣跟別人共享。
第三,除了傳統(tǒng)的VPN接入,青云還能提供零信任客戶端,讓用戶登錄到超算中心的時候更便捷和安全。
據(jù)悉,青云在保證超算中心安全的同時,還提供兩種不同類型的超算集群:
傳統(tǒng)共享型超算集群。雖然計算集群是共享的,但用戶登錄的節(jié)點為每個用戶獨享,可根據(jù)用戶需求自行安裝軟件、執(zhí)行操作,與其他用戶并不關(guān)聯(lián)。
獨享型EHPC集群。據(jù)陳海泉介紹,獨享型EHPC集群可為用戶提供一個root賬號,客戶不僅可以自由地安裝需要的系統(tǒng)軟件,還可以切換超算平臺的各種軟件。除此以外,該EHPC集群還可根據(jù)客戶的不同業(yè)務(wù)場景需求自由搭配計算、存儲和網(wǎng)絡(luò)類型,而且客戶可同時擁有自己獨享的節(jié)點,做到“無需排隊,一鍵直達(dá)”,這點在互聯(lián)網(wǎng)業(yè)務(wù)“唯快不破”的當(dāng)下,難能可貴。
展望未來,陳海泉表示,青云希望跟超算中心合作共建算力共享的算力網(wǎng)絡(luò),青云的EHPC平臺不僅能幫助超算中心私有化部署超算云平臺,還能連接全網(wǎng)算力提供外部資源,支撐突發(fā)業(yè)務(wù),避免排隊。當(dāng)超算中心自己的資源空置時,也可對外出售算力增加運營收入。