對(duì)于非IT專業(yè)人士而言,大家接觸較多的信息和通信設(shè)備,通常是個(gè)人電腦和手機(jī),很多人都不了解計(jì)算機(jī)界“皇冠上明珠”的高性能計(jì)算 (HPC) 到底是什么樣子?
其實(shí),高性能計(jì)算,指的是用大量服務(wù)器并行地對(duì)某一個(gè)任務(wù)執(zhí)行運(yùn)算,來解決工程和科學(xué)上的問題。它的用途很多,最核心的是用來模擬世界萬物。宏觀上,可以用衛(wèi)星圖像、遙感數(shù)據(jù)、氣象數(shù)據(jù)利用高性能計(jì)算來模擬地球、海洋和氣候;微觀上,青云能模擬分子原子來了解生命的原理,使藥物的研發(fā)更快速、更精確。
比如,天氣預(yù)報(bào)需要融合幾十個(gè)緯度的數(shù)據(jù),石油天然氣勘探需要進(jìn)行空間分析和建模,DNA測(cè)序需要對(duì)比成千上萬個(gè)堿基對(duì)等,這些對(duì)任意一個(gè)單一計(jì)算機(jī)來說都負(fù)荷太大了,而高性能計(jì)算可以很好應(yīng)對(duì)。
而現(xiàn)在,高性能計(jì)算這一領(lǐng)域出現(xiàn)了一個(gè)新的場景,大數(shù)據(jù)和人工智能正在與超算融合,具體體現(xiàn)在三個(gè)方面:
第一,高性能計(jì)算跟尖端科研是密不可分的。科學(xué)家要讓科技持續(xù)進(jìn)步,一定要之前的研究人員對(duì)更大規(guī)模的數(shù)據(jù)做計(jì)算,并且不斷提高計(jì)算精度。
第二,大數(shù)據(jù)驅(qū)動(dòng)存儲(chǔ)跟算力融合。以前建超算中心的時(shí)候,普遍是以算力為主導(dǎo),但在存儲(chǔ)方面出現(xiàn)新的挑戰(zhàn)。一方面,現(xiàn)在數(shù)據(jù)越來越多,比如衛(wèi)星、無人機(jī)在不斷產(chǎn)生大量的高精度照片。另一方面,數(shù)據(jù)類型也在變多,比如可穿戴設(shè)備的普及、IoT 的廣泛應(yīng)用,都在不斷產(chǎn)生各種新的、不同類型的數(shù)據(jù)。這些數(shù)據(jù)都需要利用大數(shù)據(jù)進(jìn)行處理和分析。這一改變正在驅(qū)使數(shù)據(jù)中心和算力中心互相融合,并且數(shù)據(jù)量越大,對(duì)應(yīng)的算力也需要更強(qiáng)。
第三,人工智能應(yīng)用爆發(fā)。人工智能通常指的是機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)最常用的技術(shù)是深度學(xué)習(xí)。深度學(xué)習(xí)有兩個(gè)階段:第一階段是對(duì)大量的數(shù)據(jù)進(jìn)行計(jì)算,得到訓(xùn)練模型;第二階段是通過已得到的訓(xùn)練模型,結(jié)合新的數(shù)據(jù)做推理計(jì)算,解決實(shí)際的問題,比如圖像識(shí)別、自然語言識(shí)別等,都需要推理。其中,訓(xùn)練階段需要進(jìn)行大量的浮點(diǎn)運(yùn)算,為了達(dá)到足夠的算力,就需要用很多的GPU節(jié)點(diǎn)。
為此,青云科技能夠?yàn)槠髽I(yè)提供彈性高性能計(jì)算產(chǎn)品——QingCloud EHPC。相較于傳統(tǒng)HPC,QingCloud EHPC提供了一種快捷、彈性、安全以及互通的基于云平臺(tái)的高性能計(jì)算服務(wù),它能支持計(jì)算資源的彈性定制,降低成本,提高資源利用率,具有極大的靈活性。
針對(duì)超算在尖端科技、大數(shù)據(jù)以及人工智能場景的支持,QingCloud EHPC也給出了相應(yīng)的解決方案。如超算最常見的仿真和建模業(yè)務(wù),青云提供了低延時(shí)、高帶寬的InfiniBand網(wǎng)絡(luò),高速并行文件存儲(chǔ)以及CPU/GPU的算力組合,不僅能支持大規(guī)模求解運(yùn)算,還能提供GPU桌面進(jìn)行圖形前后處理,完成一個(gè)閉環(huán)的業(yè)務(wù)場景。
對(duì)于大數(shù)據(jù)業(yè)務(wù),QingCloud云平臺(tái)提供的對(duì)象存儲(chǔ)容量達(dá)245PB,跟計(jì)算節(jié)點(diǎn)結(jié)合,可以用于大規(guī)模的數(shù)據(jù)處理和分析。計(jì)算節(jié)點(diǎn)到對(duì)象存儲(chǔ)的網(wǎng)絡(luò)帶寬有1.6T,能夠保證大數(shù)據(jù)計(jì)算的超高性能。
對(duì)于人工智能訓(xùn)練業(yè)務(wù),青云提供算力達(dá)850PFlops的A100 GPU資源池和全閃并行文件存儲(chǔ),并且能夠結(jié)合容器平臺(tái),提供性能極致優(yōu)化、輕量便捷、開源開放的人工智能平臺(tái)。
目前,數(shù)字化創(chuàng)新對(duì)企業(yè)發(fā)展和業(yè)務(wù)創(chuàng)新都提出了更大挑戰(zhàn)。青云意識(shí)到EHPC將云計(jì)算與高性能計(jì)算的結(jié)合,對(duì)于數(shù)字經(jīng)濟(jì)發(fā)展有著重要意義。為此,青云科技將緊扣技術(shù)發(fā)展趨勢(shì),繼續(xù)創(chuàng)新,不斷更新迭代彈性高性能計(jì)算能力,豐富和完善EHPC方案的能力,持續(xù)滿足用戶高性能計(jì)算需求。