對(duì)于未來(lái)世界,最大的不變就是變化。近年來(lái),隨著數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,數(shù)字化新事物、新業(yè)態(tài)、新模式推動(dòng)應(yīng)用場(chǎng)景向多元化發(fā)展,自動(dòng)駕駛、生命科學(xué)、智能制造等行業(yè)發(fā)展迅速,特別是AI大模型等人工智能技術(shù)的發(fā)展,使得算力規(guī)模不斷擴(kuò)大,算力需求持續(xù)攀升。
據(jù)《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,一個(gè)國(guó)家的計(jì)算力指數(shù)平均每提高1點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.5‰和1.8‰。從單機(jī)計(jì)算到云計(jì)算,從邊緣計(jì)算到泛在計(jì)算,從單一算力到多樣性算力,算力已成為數(shù)字經(jīng)濟(jì)的關(guān)鍵生產(chǎn)力,成為全社會(huì)數(shù)字化、智能化轉(zhuǎn)型的重要基石,成為數(shù)字時(shí)代不可或缺的核心資源。
“我們認(rèn)為,未來(lái)將是AI的時(shí)代,而云計(jì)算將打破大規(guī)模通用算力、超算、智算的邊界,延伸算力從中心到邊端的分布,賦予算力新的價(jià)值。”青云科技總裁林源表示,“日日行,不怕千萬(wàn)里;常常做,不怕千萬(wàn)事。在未來(lái),青云科技將基于十余年在云計(jì)算領(lǐng)域不斷深耕的實(shí)踐經(jīng)驗(yàn),與不同領(lǐng)域的合作伙伴一起,形成合力,更好地幫助企業(yè)駕馭AI。”
緊抓機(jī)遇 攀登“智算高峰”
近年來(lái),我國(guó)算力基礎(chǔ)設(shè)施建設(shè)成效顯著,算力產(chǎn)業(yè)不斷創(chuàng)新發(fā)展,算力持續(xù)賦能千行百業(yè)。國(guó)際數(shù)據(jù)公司(IDC)、浪潮信息、清華大學(xué)全球產(chǎn)業(yè)研究院聯(lián)合編制的《2022—2023全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示:2022年,中國(guó)整體服務(wù)器市場(chǎng)規(guī)模保持6.9%的正增長(zhǎng),占全球市場(chǎng)比重達(dá)25%,2017年至2022年的復(fù)合增長(zhǎng)率達(dá)48.8%。從國(guó)家算力指數(shù)排名看,我國(guó)計(jì)算力水平位居全球第二,處于領(lǐng)跑者國(guó)家行列。
現(xiàn)階段,算力主要可分為基礎(chǔ)算力、智能算力和高性能計(jì)算算力3種類型。其中,基礎(chǔ)算力主要基于CPU芯片,智能算力主要基于GPU芯片,而高性能計(jì)算算力主要基于CPU芯片和GPU芯片的融合。隨著云計(jì)算的不斷發(fā)展,AI、5G、物聯(lián)網(wǎng)技術(shù)逐漸成熟,智慧政務(wù)、智慧能源、智慧金融、生物醫(yī)藥、工業(yè)仿真、無(wú)人駕駛、航空遙感等應(yīng)用場(chǎng)景對(duì)高性能計(jì)算的需求不斷增長(zhǎng),算力智能化升級(jí)成為趨勢(shì)。
與此同時(shí),我國(guó)在算力技術(shù)創(chuàng)新、應(yīng)用賦能、標(biāo)準(zhǔn)建設(shè)、混合算力協(xié)同調(diào)度等方面面臨諸多挑戰(zhàn),數(shù)據(jù)中心建設(shè)也面臨多元算力難以統(tǒng)一管理、應(yīng)用無(wú)法跨平臺(tái)利用、存儲(chǔ)難以高效共享、一體化數(shù)據(jù)中心運(yùn)維管理難度大等業(yè)務(wù)難點(diǎn)。
為此,青云科技緊抓數(shù)字化轉(zhuǎn)型、信創(chuàng)產(chǎn)業(yè)發(fā)展及AI技術(shù)變革三大機(jī)遇,基于云計(jì)算技術(shù)發(fā)展與客戶需求,不斷升級(jí)算力設(shè)施相關(guān)能力,推出了青云 AI 算力調(diào)度平臺(tái)、青云 AI 算力云服務(wù),以多元算力支持企業(yè)數(shù)字化革新。
云聚算力 加速企業(yè)數(shù)字化革新
青云AI算力調(diào)度平臺(tái)集異構(gòu)基礎(chǔ)設(shè)施管理、數(shù)據(jù)存儲(chǔ)運(yùn)維、高性能分布式網(wǎng)絡(luò)等能力于一體,具備自主創(chuàng)新、功能完善、智能運(yùn)維、成熟運(yùn)營(yíng)、開(kāi)源開(kāi)放、安全合規(guī)、中立可靠、靈活部署八大優(yōu)勢(shì),以及靈活調(diào)度、高速并行存儲(chǔ)、分布式調(diào)度與管理、多區(qū)多業(yè)務(wù)資源整合、算法開(kāi)發(fā)支持、混合組網(wǎng)、容器推理服務(wù)平臺(tái)、模型倉(cāng)庫(kù)(MaaS)、AI訓(xùn)練平臺(tái)九大關(guān)鍵能力,能夠統(tǒng)一納管多種異構(gòu)服務(wù)器、存儲(chǔ)、安全等設(shè)備,對(duì)通用云計(jì)算平臺(tái)、容器平臺(tái)、高性能計(jì)算平臺(tái)、AI平臺(tái)等算力平臺(tái)的多元算力進(jìn)行統(tǒng)一調(diào)度管理,實(shí)現(xiàn)了算力的統(tǒng)一調(diào)度、統(tǒng)一管理、統(tǒng)一運(yùn)營(yíng),能夠支撐各類產(chǎn)業(yè)應(yīng)用開(kāi)發(fā)與運(yùn)營(yíng)。目前,青云AI算力調(diào)度平臺(tái)已成功在國(guó)家超算濟(jì)南中心落地實(shí)踐,助力其打造了山河云服務(wù)模式。
在資源調(diào)度能力方面,青云AI算力調(diào)度平臺(tái)做了六方面的優(yōu)化:一是通過(guò)統(tǒng)一鏡像模式,實(shí)現(xiàn)了立即調(diào)度擴(kuò)容數(shù)萬(wàn)卡資源;二是通過(guò)算法實(shí)現(xiàn)了通信鏈路的最短化,減少了數(shù)據(jù)的傳輸損耗;三是最大化系統(tǒng)利用率;四是將Kubernetes和Slurm(集群管理和作業(yè)調(diào)度系統(tǒng))的優(yōu)勢(shì)進(jìn)行結(jié)合,實(shí)現(xiàn)了預(yù)留、暫停/恢復(fù)、公平共享和關(guān)鍵作業(yè)的搶占式調(diào)度;五是支持異構(gòu)平臺(tái);六是憑借動(dòng)態(tài)靈活的資源調(diào)度,能夠優(yōu)先解決AI系統(tǒng)中最具挑戰(zhàn)性的事項(xiàng)。
在高速并行存儲(chǔ)能力方面,青云AI算力調(diào)度平臺(tái)通過(guò)青云存儲(chǔ)U10000的對(duì)象存儲(chǔ)能力構(gòu)建了統(tǒng)一的數(shù)據(jù)存儲(chǔ)底座,制定了數(shù)據(jù)生命周期分層策略,降低了存儲(chǔ)成本;通過(guò)并行文件存儲(chǔ)EPFS,能夠滿足成百上千個(gè)節(jié)點(diǎn)的同時(shí)訪問(wèn)需求;通過(guò)文件存儲(chǔ)NAS,在推理場(chǎng)景下,提供多機(jī)DPU計(jì)算所需的標(biāo)準(zhǔn)文件接口。
在混合組網(wǎng)能力方面,青云AI算力調(diào)度平臺(tái)支持跨區(qū)域高速網(wǎng)絡(luò)互聯(lián),支持不同類型資源池互聯(lián),支持獨(dú)立計(jì)算和存儲(chǔ)IB網(wǎng),支持專屬訪問(wèn)存儲(chǔ)高速網(wǎng)絡(luò),支持業(yè)務(wù)網(wǎng)絡(luò)互聯(lián)下發(fā)任務(wù),保證了數(shù)據(jù)的安全隔離。
“未來(lái),青云科技將堅(jiān)持核心代碼自研,以自主創(chuàng)新、中立可靠、靈活開(kāi)放的理念,緊跟數(shù)字化發(fā)展大潮,以創(chuàng)新產(chǎn)品、服務(wù)與方案能力,為百行千業(yè)提供數(shù)字經(jīng)濟(jì)時(shí)代的算力解決方案。”林源說(shuō)道。