8月15日,在蘇州舉行的2020全球人工智能產(chǎn)品應(yīng)用博覽會(huì)(AIExpo2020)上,浪潮最新推出的人工智能服務(wù)器NF5488A5受到關(guān)注。這款A(yù)I服務(wù)器在此前最新公布的MLPerf全球權(quán)威AI測(cè)試榜單中,僅用時(shí)33.37分鐘,就在包含128萬(wàn)張圖片的ImageNet數(shù)據(jù)集上完成Resnet50模型的訓(xùn)練,相當(dāng)于每秒訓(xùn)練23000多張圖片,單機(jī)計(jì)算性能排名第一。
MLPerf是業(yè)內(nèi)首套衡量機(jī)器學(xué)習(xí)軟硬件性能的通用基準(zhǔn),由圖靈獎(jiǎng)得主David Patterson聯(lián)合谷歌和幾所著名高校于2018年發(fā)起,得到亞馬遜、Facebook、谷歌、哈佛大學(xué)、英特爾、英偉達(dá)、阿里巴巴、浪潮等支持和參與。在最新發(fā)布的MLPerf 0.7 訓(xùn)練測(cè)試榜單中,浪潮NF5488A5人工智能服務(wù)器除了在Resenet50取得單機(jī)計(jì)算性能榜首外,還在人工智能自然語(yǔ)言理解Transformer、神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)GNMT、深度學(xué)習(xí)推薦模型DLRM、目標(biāo)監(jiān)測(cè)算法SSD等MLPerf的模型訓(xùn)練評(píng)估中均取得不俗成績(jī)。
參與打榜的這款產(chǎn)品NF5488A5是浪潮自研推出的新一代AI服務(wù)器,單機(jī)訓(xùn)練性能可達(dá)5 PetaOPS,相比上一代服務(wù)器計(jì)算性能提升234%。兩年前Facebook的科學(xué)家用32臺(tái)GPU服務(wù)器、256塊GPU花了1個(gè)小時(shí)完成了ImageNet上的Resnet50訓(xùn)練,而現(xiàn)在僅需一臺(tái)NF5488A5,即可在33分鐘完成同樣的訓(xùn)練,單臺(tái)設(shè)備訓(xùn)練效率提升近60倍。同時(shí),浪潮優(yōu)化了NF5488A5的拓?fù)浣Y(jié)構(gòu),采用NUMA綁定策略,可實(shí)現(xiàn)CPU與最近GPU的指定通信,大幅提升CPU與GPU之間的數(shù)據(jù)傳輸效率,實(shí)現(xiàn)更低的數(shù)據(jù)傳輸延遲和更高的帶寬,滿足各種AI負(fù)載高效數(shù)據(jù)通信需求。
NF5488A5可廣泛應(yīng)用于圖像視頻、語(yǔ)音識(shí)別、金融分析、智能客服等典型AI應(yīng)用場(chǎng)景,幫助AI用戶高效完成AI基礎(chǔ)設(shè)施和開(kāi)發(fā)環(huán)境的構(gòu)建,縮短開(kāi)發(fā)周期,顯著提升AI開(kāi)發(fā)和應(yīng)用效率,在享受更高計(jì)算性能的同時(shí)降低部署、運(yùn)行成本。