在AI性能基準評測領域,MLCommons?近期揭曉了MLPerf?Storage v2.0的最新測試結果,為全球AI存儲技術樹立了新的標桿。華瑞指數云ExponTech,作為AI原生企業級全場景數據基礎設施的領航者,在此次評測中大放異彩,與DDN、IBM、HPE、華為及Hammerspace等國際國內巨頭同臺競技,憑借卓越的創新技術和產品方案,斬獲了多項世界領先的成績。
此次測試中,ExponTech攜手英偉達、Scaleflux及AIC,共同打造了一套軟硬件均具創新性的解決方案。該方案旨在驗證在AI應用場景下,通過新一代分布式存儲軟件棧,驅動更為精簡高效的硬件架構,實現性能密度、容量密度的雙重提升,同時降低成本。網絡層面,采用RoCE網絡,充分展示了大規模組網能力、擴展性及并行訪問能力。
硬件配置上,ExponTech的方案獨樹一幟。不同于其他參與者采用的多臺高配置存儲服務器搭配IB網絡的方案,ExponTech僅使用了一臺2U的AIC盤框(JBOF F2026)。該盤框無CPU和內存配置,專注于提供高容量密度和硬件可靠性,2U空間內可配置多達26塊SSD盤,本次測試采用了24塊Scaleflux CSD 5000帶壓縮功能的SSD盤。盤框內嵌入了4張英偉達Bluefield-3 DPU卡,每張DPU提供400Gbps的RoCE網絡帶寬,ExponTech自主研發的WADP分布式存儲軟件完全運行于DPU內。
網絡方面,4臺英偉達Spectrum-X交換機構建起兩層RoCE網絡,驗證了大規模組網時的擁塞控制能力。基于這一網絡和WADP軟件,系統可擴展至連接1024臺盤框,形成EB級容量、上百TB級存儲帶寬的超大規模高性能存儲池。
軟件層面,ExponTech的WADP(WiDE AI Data Platform)分布式存儲軟件,基于自主研發的下一代分布式存儲引擎WiDE和元數據引擎天樞構建。在同一存儲池空間內,提供包括塊存儲、文件存儲、對象存儲及KV接口在內的豐富協議接口。本次測試的WADP軟件,完全運行于4張Bluefield-3 DPU內,每張DPU僅配備了一塊16核CPU及48GB內存,展現了WADP軟件棧的高效硬件利用效率和IO處理能力。
測試結果方面,基于單個2U存儲節點及1至2個客戶端的測試顯示,該方案輕松滿足ResNet-50模型訓練需求,單客戶端最高支持240塊GPU卡,帶寬達到23.6GiB/s。在硬件采用DPU+JBOF,CPU和內存配置相對較弱的情況下,仍領先所有參與測試的廠商方案,位居榜首。在MLPerf? Storage v2.0新推出的針對大型語言模型(LLM)訓練場景的檢查點(Checkpoint)工作負載測試中,ExponTech WADP方案在Llama3-8B模型的實測寫帶寬為16.9GiB/s,雖位居第三,但使用的物理盤容量僅為前兩名的五分之一,展現了極高的存儲軟件棧效率。
ExponTech WADP方案的亮點包括超高密度與能效、超高性能表現、極致I/O效率、彈性擴展能力、可擴展網絡驗證及存儲效率倍增。此次在MLPerf? Storage v2.0 AI Storage基準測試中取得的優異成績,不僅彰顯了ExponTech在存儲技術方面的強勁實力,也標志著其在業界的重要突破。繼2023年在SPC-1基準測試中創下世界紀錄后,ExponTech再次證明了其在企業關鍵業務與AI工作負載領域的雙重競爭力,成為全球唯一能在SPC-1和MLPerf Storage上均取得頂級成績的分布式存儲軟件,為企業級AI統一平臺的全場景覆蓋提供了堅實基礎。