伴隨20世紀(jì)70年代初第一代向量計算機(jī)的出現(xiàn),超級計算概念興起。一直以來,超級計算也與“大型”、“高速”、“昂貴”、“復(fù)雜”等一系列形容詞包裹,對于普通企業(yè)和個人而言如同遠(yuǎn)在云端。
事實上,近幾年隨著大數(shù)據(jù)、人工智能技術(shù)的深入發(fā)展和廣泛應(yīng)用,大數(shù)據(jù)和人工智能呈現(xiàn)出與超算日趨融合的趨勢。一方面,科學(xué)研究人員為了不斷提高計算精度采用的研究數(shù)據(jù)規(guī)模越來越大,大數(shù)據(jù)驅(qū)動存儲跟算力融合。另一方面,人工智能應(yīng)用全面爆發(fā),而人工智能訓(xùn)練階段需要進(jìn)行大量的浮點(diǎn)運(yùn)算,這也要求企業(yè)擁有足夠的算力支撐。
算力已經(jīng)成為重要生產(chǎn)力。
現(xiàn)在,青云科技發(fā)布的全新彈性高性能計算平臺——QingCloud EHPC ,期望借此讓超算算力走下“神壇”,深度賦能數(shù)字新基建。
QingCloud EHPC 是基于青云公有云 IaaS、PaaS 層基礎(chǔ)架構(gòu),聯(lián)合國家級超算中心,構(gòu)建數(shù)據(jù)和算力相融合的資源池,為生命科學(xué)、海洋氣象、地理測繪等基礎(chǔ)科研領(lǐng)域,以及前沿科學(xué)與大數(shù)據(jù)、人工智能技術(shù)結(jié)合形成的新興場景,提供從上云計算到結(jié)果產(chǎn)出的全流程 SaaS 化計算服務(wù)。
QingCloud EHPC高性能計算平臺有哪些能力?
在青云云平臺&服務(wù)部高級總監(jiān)陳海泉看來,高性能計算通過采用大量服務(wù)器并行地對某一個任務(wù)執(zhí)行運(yùn)算,來解決工程和科學(xué)上的問題。它的用途很多,最核心的是用來模擬世界萬物。宏觀上,可以用衛(wèi)星圖像、遙感數(shù)據(jù)、氣象數(shù)據(jù)利用高性能計算來模擬地球、海洋和氣侯;微觀上,能模擬分子原子來了解生命的原理,使藥物的研發(fā)更快速、更精確。
QingCloud EHPC產(chǎn)品正是基于青云公有云IaaS平臺、PaaS平臺的云基礎(chǔ)設(shè)施,既能為用戶提供公有云上的超算服務(wù),又能為有需求的用戶提供專屬云和混合云等多種形態(tài)的產(chǎn)品。應(yīng)對生命科學(xué)、CAE仿真、海洋氣象等相關(guān)領(lǐng)域的高性能計算需求,提供豐富多樣的使用模式,適配多種應(yīng)用場景。通過統(tǒng)一管理的平臺,使工程師、研究人員可以突破本地的HPC基礎(chǔ)設(shè)施限制,快速開始云上創(chuàng)新。
據(jù)悉,QingCloud EHPC擁有行業(yè)領(lǐng)先的高配置資源,支持 CPU 計算、GPU 計算、裸金屬計算。其中,CPU 計算采用行業(yè)領(lǐng)先的 Intel 6258R 型號 CPU,主頻 2.7GHz,單核心峰值 86.4Gflops,單節(jié)點(diǎn)峰值 4.823Tflops;GPU 計算采用 Intel 8358 處理器,配置 8 個 NVIDIA A100 GPU卡。
QingCloud EHPC采用專用IB網(wǎng)絡(luò),CPU 服務(wù)器內(nèi)網(wǎng)帶寬達(dá)到 100Gbps,GPU 服務(wù)器內(nèi)網(wǎng) 帶寬達(dá)到 200Gbps,帶來更高吞吐、更低延遲,大大解決了高性能計算領(lǐng)域上的數(shù)據(jù)量大傳輸?shù)钠款i。
除了提供強(qiáng)勁的算力外,QingCloud EHPC提供300多款軟件,覆蓋分子生物學(xué)、新能源、新材料、大氣海洋環(huán)境、地球、物理等諸多領(lǐng)域,用戶可以即來即用。
青云QingCloud EHPC產(chǎn)品經(jīng)理苗慧介紹,QingCloud EHPC提供了一種快捷、彈性、安全以及互通的公共云高性能計算服務(wù),它能支持計算資源的彈性定制,降低成本,提高資源利用率,具有極大的靈活性。
具體而言,QingCloud EHPC具備節(jié)點(diǎn)動態(tài)調(diào)整能力,彈性伸縮、可擴(kuò)展,用戶按需選擇計算實例類型,無需排期,即買即用。
同時,QingCloud EHPC用戶只管使用,無需關(guān)注 EHPC 集群本身的設(shè)備運(yùn)維、網(wǎng)絡(luò)安全、機(jī)房故障等一系列運(yùn)維事件。借助平臺提供的運(yùn)維管理模塊,就能實時查看運(yùn)行狀態(tài)、消費(fèi)詳情、業(yè)務(wù)執(zhí)行進(jìn)展等,省心又放心。
費(fèi)用方面,QingCloud EHPC既可按傳統(tǒng)的核時方式,又可以按使用時長支付資源費(fèi)用,同時內(nèi)置軟件平臺,可幫用戶節(jié)省大量設(shè)備投入和軟件采購許可費(fèi)用。
另外,保障數(shù)據(jù)安全性方面,QingCloud EHPC提供多租戶隔離機(jī)制,可大大提高數(shù)據(jù)安全性和高可用性,有效消除安全隱患。
苗慧表示,科研院校、研發(fā)類企業(yè),包括汽車制造、新能源/新材料、芯片制造等行業(yè)將是QingCloud EHPC首批重點(diǎn)關(guān)注拓展的行業(yè)。
如何使用QingCloud EHPC?
那么用戶要如何才能使用到QingCloud EHPC這項服務(wù)呢?其實步驟也很簡單。
QingCloudEHPC提供兩種集群。第一種形式是青云作為平臺方,提供 400多個節(jié)點(diǎn)的共享隊列,采用傳統(tǒng)超算的形式,用戶進(jìn)來提交作業(yè),按照核心數(shù)和作業(yè)運(yùn)行時間進(jìn)行計費(fèi)。第二種形式是用戶購買專屬的EHPC集群,支持root權(quán)限,可以對集群進(jìn)行最高權(quán)限的配置,可以采用EHPC集群的形式,既構(gòu)造自己專屬的計算節(jié)點(diǎn),這一形式根據(jù)計算節(jié)點(diǎn)的配置和計算節(jié)點(diǎn)的使用時長進(jìn)行計費(fèi)。
QingCloudEHPC的集群創(chuàng)建過程分為三個步驟:
第一步,準(zhǔn)備網(wǎng)絡(luò)。點(diǎn)擊新建網(wǎng)絡(luò),為了保證集群內(nèi)所有節(jié)點(diǎn)、存儲、共享軟件倉庫在一個私有網(wǎng)絡(luò)內(nèi),因此需要準(zhǔn)備一個私有網(wǎng)絡(luò)。
第二步,創(chuàng)建集群的配置,需要對登錄節(jié)點(diǎn)、管控節(jié)點(diǎn)、計算節(jié)點(diǎn)進(jìn)行配置,進(jìn)行數(shù)量上的確定。
第三步,點(diǎn)擊確定。
如此,集群將在5分鐘內(nèi)創(chuàng)建完成,用戶即可提交作業(yè)。
提交作業(yè)也分為三步:
首先,選擇軟件,勾選青云內(nèi)置的一些軟件版本號。
其次,指定作業(yè)執(zhí)行命令。
最后,點(diǎn)擊確定,直接運(yùn)行。
這樣最終系統(tǒng)將根據(jù)用戶指定的作業(yè)執(zhí)行命令文件創(chuàng)建作業(yè)輸出目錄,每一個作業(yè)都會自動創(chuàng)建一個作業(yè)輸出目錄,相關(guān)輸出文件都會輸出到目錄中,用戶可以進(jìn)行結(jié)果文件查看、日志文件查看、過程文件查看。
目前,QingCloudEHPC 推出了限量的“10000核時免費(fèi)算”優(yōu)惠措施,有需要的小伙伴要抓緊申請了。