在人工智能與高性能計算領域需求激增的今天,數據存儲的重要性愈發凸顯,成為支撐算力釋放的關鍵因素。上海霄云信息科技有限公司近期隆重發布了其全新一代AI存儲產品——霄云銀河存儲。這款存儲系統專為人工智能模型訓練、高性能計算(HPC)以及生命科學等應用場景量身打造,憑借“極速、高可用、全鏈路可視”的核心理念,刷新了企業級存儲的性能標準。
霄云銀河存儲針對三大核心場景,全面釋放存儲潛能。在人工智能模型訓練與推理方面,該產品內置GPU Direct Storage技術,實現了數據直接傳輸至GPU顯存,無需經過CPU中轉,讀取性能高達90GB/s,寫入性能達到75GB/s,顯著提升了萬億參數大模型的訓練效率。同時,單個元數據服務器(MDS)能夠支持50億文件的管理,優化了CheckPoint存儲,進一步加速了模型訓練的恢復流程。
對于高性能計算(HPC)領域,霄云銀河存儲支持百萬級IOPS與微秒級延遲,通過并行文件系統與InfiniBand高速網絡,完美滿足了氣象模擬、石油勘探計算等場景對海量數據并行處理的需求。Multi-Rail多網卡聚合技術使得帶寬利用率超過90%,確保了多客戶端并發訪問時的無擁塞狀態。
在生命科學領域,霄云銀河存儲高效處理基因測序、蛋白折疊等超大規模非結構化數據,結合RAID 10/5/6冗余架構,為科研數據的完整性與分析的連續性提供了堅實保障。
霄云銀河存儲顛覆性設計,采用“應用-雙控-存儲”三層架構,軟硬件協同創新,重構存儲底層邏輯。雙控服務器層內置高性能并行文件系統,支持無縫橫向擴展,性能隨節點增加線性提升。同時,雙控機箱能夠實現10秒級故障切換,配合共享硬件RAID,確保控制器故障時業務零中斷。存儲節點層采用全閃存RAID陣列,支持熱插拔與在線擴容,數據冗余無需軟件同步,降低了軟件復雜性,同時不占用InfiniBand網絡帶寬。統一命名空間管理使得新增節點能夠自動納入資源池,提升了擴展性。
霄云銀河存儲具備六大功能特性,引領未來存儲發展。GPU Direct Storage技術使得數據直接傳輸至GPU顯存,消除了CPU瓶頸,模型訓練速度提升了兩倍以上。CheckPoint智能優化系統能夠自動管理存儲資源,加速模型訓練恢復效率。極速故障恢復功能使得雙控高可用系統最快在10秒內完成I/O接管,保障了關鍵業務的連續性。企業級安全與管理功能包括CSI私有客戶端容器化部署,適配Kubernetes生態,以及用戶配額與ACL訪問控制,滿足了金融、醫療等行業的合規需求。硬件級冗余支持RAID 10/5/6,硬盤故障時自動重建,數據安全性超越傳統軟件RAID方案。全鏈路監控系統采用獨立模塊化設計,實時可視化IO性能、硬件狀態及網絡負載,有助于精準故障定位。
在技術亮點方面,霄云銀河存儲通過專用硬件處理XOR運算,徹底釋放了CPU資源,同時避免了節點間數據交換占用網絡帶寬。統一命名空間實現了跨節點文件系統的無縫整合,用戶無需手動映射路徑,管理效率提升了三倍。InfiniBand提供400Gbps基礎傳輸速度,配合Multi-Rail負載均衡,實現了大規模并行訪問的無擁塞狀態。
霄云銀河存儲不僅是存儲設備,更是AI基礎設施的中樞。通過軟硬件協同優化,解決了傳統存儲在擴展性、延遲與管理復雜度上的痛點,實現了數據流動與算力增長的完美匹配,助力企業在AI時代搶占先機。
上海霄云信息科技有限公司,成立于2015年,是一家專注于高性能分布式存儲領域的高新技術企業。其核心技術團隊歷經十年鉆研,成功轉化上海市科委“PB級海量存儲系統”課題成果。霄云科技自研的高性能分布式存儲產品,具備高品質、高可靠性、自主知識產權及高技術壁壘,已廣泛應用于醫療、金融、電信、教育、制造等多個行業,贏得了用戶的高度贊譽。