近期,新華三集團,紫光股份旗下的一員大將,攜手NVIDIA,共同揭曉了一項革新性的技術集成方案。該方案基于NVIDIA AI數據平臺參考設計,旨在構建一個更加智能化、靈活且安全的大數據處理架構,為AI推理場景帶來前所未有的效能提升。
在AI技術日新月異的今天,用戶對AI服務的即時響應需求愈發迫切。同時,AI推理若未能基于最新數據,便可能導致信息失真、邏輯混亂,極大影響其可信度和實用性。新華三此次推出的AI數據平臺解決方案,成功跨越了“算力”與“存力”之間的鴻溝,實現了從硬件底層到AI應用上層的全鏈路數據加速流通。這一突破不僅極大提升了AI推理的實時性、相關性和精確度,還顯著優化了整體運行效率,為真實場景中的大模型應用帶來了更快的響應速度和更佳的用戶體驗。
新華三的AI數據平臺解決方案,是軟硬件深度協同的典范。它融合了新華三與NVIDIA的頂尖技術,打造了一個存算網高度集成的智能數據平臺。通過上層軟件平臺的協同優化,為AI基礎設施注入了強大的動力,使得AI大模型的推理能力得到了顯著提升。
該方案集成了NVIDIA Spectrum-X AI以太網網絡平臺,包括高性能以太網交換機、BlueField-3 DPU數據處理器以及ConnectX SuperNIC,將普通以太網的帶寬利用率大幅提升至97%以上,有效應對流量高峰,確保存儲與計算節點間的高速連接。BlueField-3 DPU與新華三的Polaris X20000存儲系統完美融合,支持多項先進技術,如NVMe over Fabrics和NVIDIA GPU-Direct Storage,實現了存儲的卸載與加速,進一步提升了存儲性能并降低了能耗。
新華三的Polaris X20000系列存儲系統,專為AI智算場景設計,搭載了全新自研存儲引擎,能夠滿足AI/HPC場景下海量數據處理的高性能需求。其單節點即可實現120GB/s帶寬和200萬IOPS,集群性能更是近線性增長,完美契合AI大模型訓練中海量小文件高并發和百TB級帶寬的需求。同時,該系統將多種存儲協議集成于統一平臺,實現了數據采集、模型訓練到分發全流程的數據零遷移。其卓越的可靠性,如毫秒級故障上報與秒級切換,確保了訓練任務的不中斷,為企業提供了穩定、高效的存儲支持。
在軟件層面,該方案同樣表現出色。在AI-Q NVIDIA Blueprint的加持下,代理式系統能夠無縫連接至Polaris X20000高性能數據存儲平臺。AI-Q利用NVIDIA NeMo Retriever加速數據的提取與檢索,這款軟件能夠高效處理海量結構化、半結構化及非結構化數據,如文本、PDF、圖像、視頻等,從而顯著提升了RAG(檢索增強生成)應用的響應速度。同時,NVIDIA NeMo Guardrails確保了推理問答交互的安全性、準確性和主題相關性。而新華三自主研發的靈犀使能平臺(LinSeer Hub)則作為上層管理平臺,提供了強大的AI智能體和推理引擎功能。
通過軟硬件的深度整合,新華三的AI數據平臺解決方案在提升大模型推理性能與Token處理速度方面取得了顯著成效。這一方案為企業提供了實時的數據洞察能力,助力其業務場景的智能化升級。隨著AI大模型的蓬勃發展,數據已成為AI生產力的核心。新華三作為存儲領域的佼佼者,憑借Polaris X20000系列的卓越性能和靈活性,進一步增強了AI數據平臺的能力。而NVIDIA則通過其硬件加速和軟件能力,充分釋放了Polaris存儲硬件的潛力,幫助新華三實現了從“數據倉庫”到“智能數據平臺”的華麗轉身,構建了完整的AI數據閉環和高效AI基礎設施。