9月19日,青云科技發(fā)布針對AI算力全新推出的全棧產品與服務,正式推出AI算力調度平臺與AI算力云服務。青云科技總裁林源在發(fā)布會和采訪中闡述了AI將給應用和算力帶來的變化,他認為“AI領域一定會出現巨頭,但不是一家獨立的公司,而是一個小的生態(tài)。”
AI驅動應用與算力變革 智算中心迎挑戰(zhàn)
自2022年底ChatGPT橫空出世至今,國際與國內科技公司紛紛展開競逐,以大模型為代表的AIGC在全球引發(fā)了新一波AI浪潮。
每一次科技創(chuàng)新都給生產生活方式帶來變革,正如移動互聯網開啟萬物互聯,云計算讓企業(yè)IT遷徙上云,每一次科技創(chuàng)新都給生產生活方式帶來變革。得益于AI高效的生產力與簡單的交互方式,青云科技總裁林源認為,新一波AI浪潮在帶來生產力變革的同時,還將帶來商業(yè)模式、應用門檻、底層架構等眾多變革,產生大量新市場機會。
他表示,相較于過去十年,AI驅動應用呈現四大變化:首先,移動互聯網、數字化的服務應用場景,轉變?yōu)樗袘枚家獡肀I或被AI改造,企業(yè)數智化取代數字化;第二,從以CPU為核心變?yōu)橐訥PU為核心驅動應用的創(chuàng)新,“未來的時代一定是一個以GPU為核心的時代”;第三,由于AI訓練成本極高,未來AI應用由延遲敏感型轉變?yōu)橐猿杀久舾行蜑橹鳎瑢乃懔难舆t低的東部沿海,向價格更便宜的西部地區(qū)發(fā)展,未來算力分布更加分散;第四,支撐的應用類型變化,由傳統(tǒng)應用和云原生應用,轉變?yōu)樵圃鷳?AI應用,客戶業(yè)務更復雜,業(yè)態(tài)更豐富,對技術和平臺的挑戰(zhàn)越來越多。
過去半年中,隨著大模型產品的爆發(fā),AI帶來的變革已經逐漸凸顯,其中作為AI應用承載的算力格局變化尤為明顯。
中國信通院發(fā)布的《中國綜合算力指數(2023年)》顯示,截至2023年6月底,我國算力總規(guī)模達到197EFLOPS,其中智能算力規(guī)模占整體算力規(guī)模的比例提高到25.4%,智能算力規(guī)模同比增長達45%,比算力規(guī)模整體增速高15個百分點。
AI熱潮下,眾多智算中心項目如雨后春筍般落地開工,國家信息中心與相關部門聯合發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》顯示,目前全國有超過30個城市正在建設或提出建設智算中心。
在建設如火如荼的同時,智算中心也存在隱憂。林源指出,當前智算中心面臨多方面挑戰(zhàn)。
對于智算中心的主要建設者地方政府、國資央企和地方AI集成商來說,首要挑戰(zhàn)是成本和技術。智算中心投資巨大,一臺最新的NVIDIA的服務器就要兩百萬,未來能否收回成本以及盈利,取決于運營效率與平臺能力,前者降低成本,后者決定能賣給多少客戶。而相比于投資與建設,智算中心的運營更專業(yè)復雜,目前各中心運營能力參差不齊,難以應對。
他直言:“行業(yè)內大家對于‘智算中心要怎么建?建成什么樣?未來要支撐什么業(yè)務?’并沒有想的很透徹。”因此造成了有智算功能的某計算中心建成后,由于只支持特定GPU,所以缺乏客戶,運營不起來的情況。
應需而生 實踐落地 青云AI算力調度平臺發(fā)布
新一波AI熱潮下,智能算力規(guī)模將迎來更加快速的增長,智算中心如何設計規(guī)劃,實現兼顧AI應用、云原生應用與傳統(tǒng)應用需求,支持異構CPU/GPU,高效運營達到盈利?
青云的答案是青云AI算力調度平臺。
青云科技產品經理苗慧表示,青云AI算力調度平臺是包括智算中心在內的算力中心建設的新模式,讓算力中心像管理本地資源一樣管理AI基礎設施,實現多元算力統(tǒng)一調度、智能化算力管理,支持大模型訓練場景,提供多種AIGC模型的一站式交付平臺,支撐行業(yè)應用計算、高性能計算、AI計算等多種應用模式。
青云AI算力調度平臺具備九大關鍵能力:多區(qū)多業(yè)務資源整合、混合組網、容器推理服務平臺、分布式調度與管理、算法開發(fā)支持、模型倉庫(MaaS)、AI訓練平臺、靈活調度、高速并行存儲。
相較于市面上其他算力調度產品,苗慧表示,青云AI算力調度平臺在資源靈活調度方面更具優(yōu)勢。
原因在于,青云針對大規(guī)模計算集群研發(fā)了更優(yōu)化的調度算法,所有節(jié)點、服務器和存儲設備都有路徑標簽,通過算法計算最短鏈路,盡可能調度同一個交換機內的兩個節(jié)點,減少數據的傳輸損耗。此外,青云在應用環(huán)境上使用K8s和Slurm兩種調度平臺同時為客戶服務,可以實現提交分布式計算任務時,相關卡、CPU、進程等調度信息都能立刻獲取到,在顆粒度和運維傳統(tǒng)機器等方面也有更多優(yōu)化。多措并舉,實現更好的算力調度,更好的資源利用。
“青云AI算力調度平臺的服務對象是現在和未來投入智算中心建設的企業(yè),算力中心現在的投資者和未來的運營者。”
對算力中心來說,青云AI算力調度平臺使用效果如何,實踐案例最有說服力。
據林源介紹,青云AI算力調度平臺正式發(fā)布前,已經在國家超級計算濟南中心(以下簡稱“濟南超算”)應用,取得了良好效果。
濟南超算擁有超1000P算力,300P存儲,是一個多元異構算力中心,包括HPC、智算和以CPU為主的云計算,既有NVIDIA GPU,也考慮到國產化兼容,擁有一部分國產GPU。自3年前起,濟南超算的整個調度平臺由青云科技獨家供應,運營至今,平穩(wěn)支撐濟南超算來自高校的傳統(tǒng)科學計算、政務云和企業(yè)數字化應用上云、智慧城市、AI等多類客戶群體業(yè)務,助力濟南超算提高算力資源利用,目前已經實現盈利。
用林源的話說,濟南超算案例說明“青云AI算力調度平臺具備所說的能力,我們干過,而且干成了。”
AI算力云服務 構建開放的生態(tài)同盟
發(fā)布會上,青云還正式發(fā)布了青云AI算力云服務,介紹了青云AI生態(tài)合作伙伴體系。
林源表示,“青云AI算力云服務是以青云為主,對外運營的一個AI算力服務”。獨特之處在于,該服務不是云廠商的獨角戲,而是定位為一個開放的生態(tài)同盟,青云與眾多合作伙伴一起聯營AI算力云。
采用生態(tài)方式運營,源于AI市場邏輯的改變。他指出,過去的云計算十年中,服務商可以從底層的數據中心、硬件到軟件、PaaS都自建、自投、自營,但自己干的越多,研發(fā)費用越高,成本越重。AI時代,做好每一層都需要長時間積累和巨大投入,所需成本遠超此前,對于企業(yè)來說所有業(yè)務自己做難度極大成本太高。
與此同時,對于客戶來說,他們希望獲得一個完整的解決方案,包括機房、算力、調度平臺、模型驅動、模型、Model Service、上層應用等所有。因此,林源認為,在AI領域一定會出現巨頭,但不應該是一家獨立的公司,而是一個小的生態(tài),聚合起來提供包含每一層的服務,彼此開放,長期共贏。
青云AI算力云服務生態(tài)主要圍繞:AI 算力基礎設施的生態(tài)共享、AI 算力大模型的資源整合以及 AI 數據資源的生態(tài)整合。在這個生態(tài)中,青云只干自己最擅長的——AI算力調度平臺。
據發(fā)布會上展示,青云AI算力生態(tài)體系已初見雛形:AI算力組建生態(tài)囊括Intel、NVIDIA、AMD、中科曙光、天數智芯、燧原科技、中科馭數、大禹智芯等國內外企業(yè);AI模型生態(tài)包括智譜清言、紫光太初2.0、商湯科技商量等多個大模型;算力服務生態(tài)既包括濟南超算、清華大學智算中心,也有中國電信這樣的算力供應方;最上層已經有金融、交通、制造業(yè)、能源、自然資源等行業(yè)應用生態(tài)。
從對話的ChatGPT到生成照片的妙鴨相機,AI已經在多個領域展現了驚人的生產力與創(chuàng)造力,新一波AI大潮席卷而來,模型迭代迅速,智能算力建設與應用落地加速,企業(yè)如何抓住市場新機遇,踏浪向前?
面對AI帶來的一系列變革,青云希望通過開放的、成熟的、可運營的AI算力調度平臺,通過自營、合營乃至支撐第三方運營的方式,與生態(tài)同盟一起貢獻“AI Cloud”,共同前行。