在人工智能(AI)時代的大潮中,數(shù)據(jù)密集型工作負載的需求急劇上升,給現(xiàn)代服務(wù)器帶來了前所未有的挑戰(zhàn)。其中,如何確保計算能力與內(nèi)存帶寬的同步增長,成為了亟待解決的核心難題。AI、高性能計算(HPC)及實時分析等前沿領(lǐng)域,對內(nèi)存子系統(tǒng)的數(shù)據(jù)傳輸速度提出了極為嚴苛的要求,任何微小的延遲都可能成為性能提升的瓶頸。
在此背景下,一種新型內(nèi)存技術(shù)——MRDIMM(多路復(fù)用寄存雙列直插內(nèi)存模塊)應(yīng)運而生,迅速吸引了業(yè)界的廣泛關(guān)注。MRDIMM能否成為AI存儲領(lǐng)域的明日之星?它將對內(nèi)存市場帶來怎樣的深遠影響?這一切,都值得我們深入探討。
MRDIMM的誕生并非偶然,其根源可追溯到DDR4時代的LRDIMM(減載雙列直插內(nèi)存模塊)。LRDIMM的設(shè)計初衷在于減輕服務(wù)器內(nèi)存總線的負載,同時提升內(nèi)存的工作頻率與容量。與傳統(tǒng)的RDIMM(寄存雙列直插內(nèi)存模塊)相比,LRDIMM創(chuàng)新性地引入了數(shù)據(jù)緩沖器(DB)功能,這一設(shè)計不僅降低了主板上的信號負載,還為更大容量的內(nèi)存顆粒創(chuàng)造了條件,從而顯著提升了系統(tǒng)內(nèi)存容量。
在DDR4時代,經(jīng)過多輪討論,由中國瀾起科技公司提出的“1+9”方案(1顆RCD+9顆DB)最終成為DDR4 LRDIMM的國際標(biāo)準(zhǔn)。這一成就彰顯了瀾起科技在內(nèi)存技術(shù)領(lǐng)域的強大研發(fā)實力。進入DDR5時代,LRDIMM架構(gòu)演變?yōu)椤?+10”,但隨著DDR5內(nèi)存模組容量的大幅增加,其性價比優(yōu)勢逐漸減弱。此時,MRDIMM應(yīng)運而生,它沿用了與LRDIMM類似的“1+10”技術(shù)架構(gòu),即搭配1顆多路復(fù)用寄存時鐘驅(qū)動器(MRCD)芯片和10顆多路復(fù)用數(shù)據(jù)緩沖器(MDB)芯片,實現(xiàn)了更高的內(nèi)存帶寬,滿足了現(xiàn)代服務(wù)器對內(nèi)存帶寬的迫切需求。
隨著CPU核心數(shù)量和速度的不斷提升,內(nèi)存必須以更快的速度提供數(shù)據(jù)。MRDIMM通過同時操作兩個內(nèi)存通道,實現(xiàn)了比標(biāo)準(zhǔn)DDR5 DIMM更高的數(shù)據(jù)吞吐量。簡而言之,它將兩個DDR5 DIMM相結(jié)合,向主機提供兩倍的數(shù)據(jù)速率。目前,第一代MRDIMM的速度已達8800MT/s,第二代更是達到了12800MT/s,未來幾代產(chǎn)品的速度預(yù)計還將大幅提升。
近年來,服務(wù)器CPU技術(shù)的發(fā)展趨勢明顯:CPU廠商不斷增加內(nèi)核數(shù)量,核心數(shù)呈指數(shù)級增長。與此同時,數(shù)據(jù)中心服務(wù)器內(nèi)存對速度和容量的需求也以驚人的速度攀升。然而,“內(nèi)存墻”問題日益凸顯,成為制約系統(tǒng)性能提升的關(guān)鍵因素。傳統(tǒng)內(nèi)存RDIMM的傳輸帶寬增長緩慢,遠遠跟不上CPU核心數(shù)量的增長速度。這也是AMD和英特爾轉(zhuǎn)向DDR5內(nèi)存的重要原因之一。
在美光和英特爾的聯(lián)合測試中,MRDIMM展現(xiàn)出了卓越的性能。在內(nèi)存容量相同的情況下,MRDIMM的運算效率相比RDIMM提高了1.2倍;使用容量翻倍的高尺寸(TFF)MRDIMM時,運算效率更是提高了1.7倍,內(nèi)存與存儲之間的數(shù)據(jù)遷移減少了10倍。在AI推理方面,MRDIMM同樣表現(xiàn)出色,以運行meta Llama 3 8B大模型為例,使用MRDIMM后,詞元的吞吐量顯著提升,延遲大幅降低,CPU利用效率和末級緩存(LLC)延遲也得到了顯著改善。
面對這一技術(shù)革新,處理器和存儲設(shè)備巨頭紛紛布局相關(guān)產(chǎn)品。英特爾推出了專為高性能計算和AI等計算密集型工作負載設(shè)計的至強6性能核處理器,最高配備128個性能核,并支持新型內(nèi)存技術(shù)MRDIMM。AMD也不甘落后,其下一代“Zen 6”架構(gòu)的EPYC霄龍系列服務(wù)器處理器將首次支持MRDIMM內(nèi)存條。存儲方面,美光、Rambus、瑞薩電子等企業(yè)也相繼推出了MRDIMM相關(guān)產(chǎn)品或解決方案。
在國內(nèi),瀾起科技等企業(yè)也開始積極布局MRDIMM技術(shù)。經(jīng)過前期的戰(zhàn)略布局和持續(xù)的研發(fā)投入,瀾起科技已完成時鐘發(fā)生器芯片量產(chǎn)版本研發(fā),并成為全球兩家可提供第一子代MRCD/MDB芯片的供應(yīng)商之一。其他國內(nèi)企業(yè)雖然暫時進度較慢,但也開始保持對新技術(shù)、新產(chǎn)品形態(tài)的關(guān)注與探索。
展望未來,第二子代MRDIMM的數(shù)據(jù)傳輸速率將達到12800MT/s,相比第一子代有了顯著提升。在高性能計算、人工智能等對內(nèi)存帶寬需求較大的工作負載場景下,MRDIMM有望成為應(yīng)用系統(tǒng)主內(nèi)存的優(yōu)選方案。同時,隨著更多服務(wù)器CPU平臺支持MRDIMM,包括一些ARM架構(gòu)的CPU平臺,MRDIMM的生態(tài)將進一步完善,推動其行業(yè)滲透率的提升以及MRCD/MDB芯片需求的增長。
值得注意的是,雖然MRDIMM與HBM(高帶寬內(nèi)存)在技術(shù)上有所不同,但兩者在未來都有可能成為AI和高性能計算的主流內(nèi)存解決方案。它們各有優(yōu)勢,分別適用于不同的應(yīng)用場景,共同推動內(nèi)存市場的革新與發(fā)展。