NVIDIA在近期的一次重大技術發布中,隆重推出了NVIDIA Spectrum-XGS以太網技術,這一創新被視為連接未來AI超級工廠的橋梁。通過其獨特的跨區域擴展(scale-across)能力,該技術能夠將分布在不同地理位置的數據中心整合為一個龐大的AI運算體系,其規模可達十億瓦級別。
NVIDIA Spectrum-XGS以太網不僅繼承了Spectrum-X平臺的橫向擴展架構優勢,還實現了跨地域數據中心的無縫連接。它專為AI時代設計,能夠迅速將巨量數據集傳輸至AI模型中,并有效協調各數據中心間GPU的通信,極大地提升了數據處理的效率。
在即將召開的年度芯片及系統架構頂級會議Hot Chips上,NVIDIA計劃詳細介紹這一新技術,以及其在推理和加速計算領域的最新進展,包括NVIDIA網絡、數據中心機架設計、神經渲染技術、GB10超級芯片、DGX Spark項目,以及集成硅光子學的共封裝光學器件(CPO)交換機等。
隨著AI應用的爆發式增長,傳統數據中心在單個設施內的功率和容量已接近極限。為了繼續擴展數據中心的規模,必須跨越物理建筑的界限,然而現有的商用以太網基礎設施因延遲高、抖動大以及性能不穩定等問題,難以滿足這一需求。NVIDIA Spectrum-XGS以太網正是為了解決這些問題而生,它通過創新的跨區域擴展技術,打破了現有基礎設施的限制。
NVIDIA的創始人兼CEO黃仁勛表示:“AI工業革命已經到來,而巨型AI工廠正是這場變革的核心基礎設施。在縱向擴展(scale-up)和橫向擴展(scale-out)之后,我們通過NVIDIA Spectrum-XGS以太網引入了跨區域擴展(scale-across)技術,使得不同城市、國家甚至大洲的數據中心能夠組合成一個龐大的AI超級工廠。”
作為AI計算的“第三大支柱”,跨區域擴展技術完全集成于Spectrum-X平臺,通過先進的算法動態調整網絡和數據中心設施間的距離適配。借助自動調節的遠距離擁塞控制、精確的延遲管理以及端到端遙測技術,NVIDIA Spectrum-XGS以太網將集合通信庫的性能提升了近一倍,顯著加速了多GPU和多節點的通信,實現了異地AI集群性能的可預測性。
CoreWeave等超大規模云提供商已經開始部署這一新型基礎設施,其中CoreWeave將成為首批使用NVIDIA Spectrum-XGS以太網連接其數據中心的企業之一。NVIDIA Spectrum-X以太網網絡平臺提供的帶寬密度是傳統以太網的1.6倍,由NVIDIA Spectrum-X交換機和ConnectX-8 SuperNIC組成,為構建未來AI平臺的企業提供了無縫擴展、超低延遲和卓越性能。
此次發布是NVIDIA一系列網絡創新技術發布的延續,包括NVIDIA Spectrum-X和NVIDIA Quantum-X CPO網絡交換機等。這些技術共同協作,能夠將位于不同地點的數百萬顆GPU整合成強大的AI工廠,突破大規模AI基礎設施的性能和效率極限,同時降低能耗和運營成本。