8月8日晚,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在計(jì)算機(jī)圖形界頂級(jí)會(huì)議SIGGRAPH上發(fā)表主題演講,并且宣布推出新一代GH200 Grace Hopper超級(jí)芯片及相應(yīng)平臺(tái)。
黃仁勛在演講中甚至說(shuō)到,“生成式 AI 時(shí)代和 AI 的 iphone 時(shí)刻已經(jīng)到來(lái)”。
那么英偉達(dá)這次帶來(lái)的新品到底有多強(qiáng)呢?
新一代的GH200 Grace Hopper平臺(tái)是專為處理大語(yǔ)言模型、推薦系統(tǒng)、矢量數(shù)據(jù)庫(kù)等全球最復(fù)雜的生成式 AI 工作負(fù)載而構(gòu)建。
平臺(tái)采用雙配置,提供的內(nèi)存容量和帶寬比當(dāng)前產(chǎn)品分別增加 3.5 倍和 3 倍,包括一個(gè)擁有 144 個(gè) Arm Neoverse 內(nèi)核、8 petaflops 的 AI 性能和 282GB 最新 HBM3e 內(nèi)存技術(shù)的單個(gè)服務(wù)器。新平臺(tái)可以通過(guò) Nvidia NVLink™ 與其他超級(jí)芯片連接,從而實(shí)現(xiàn)協(xié)同工作,部署當(dāng)下大型生成式 AI 模型。該技術(shù)使 GPU 可以完全訪問(wèn) CPU 內(nèi)存,在雙配置中可提供總計(jì) 1.2TB 的快速內(nèi)存。黃仁勛表示,一臺(tái)服務(wù)器可以同時(shí)裝載兩個(gè)GH200超級(jí)芯片,大型語(yǔ)言模型的推理成本將會(huì)大幅降低。
到底有多夸張呢?
投資800萬(wàn)美元Grace Hopper,就相當(dāng)于8800個(gè)價(jià)值1億美元的x86 GPU,意味著成本降低12倍,能耗降低20倍。
除此之外,英偉達(dá)還發(fā)布了AI Workbench。
其能夠?yàn)殚_(kāi)發(fā)者提供一個(gè)統(tǒng)一、易用的工作空間,使他們有能力在個(gè)人電腦或工作站上快速創(chuàng)建、測(cè)試和微調(diào)生成式 AI 模型,并將這些模型擴(kuò)展到幾乎所有數(shù)據(jù)中心、公有云或DGX Cloud。
另外,英偉達(dá)在會(huì)上還發(fā)布了3款適用于臺(tái)式工作站的GPU,分別是RTX 5000、RTX 4500和RTX 4000,可以為可擴(kuò)展開(kāi)放式3D世界生態(tài)系統(tǒng)通用場(chǎng)景描述提供加速。
最后,基于GH200 Grace Hopper平臺(tái)的新系統(tǒng)將于2024年第二季度投產(chǎn)。
毫無(wú)疑問(wèn),英偉達(dá)最新芯片的推出將對(duì)于AI來(lái)說(shuō)又是一支強(qiáng)心劑,對(duì)于大模型的效率和成本能帶來(lái)明顯改觀。同時(shí),也將繼續(xù)鞏固英偉達(dá)在AI領(lǐng)域的地位。
不久前的6月份,AMD發(fā)布大模型專用芯片Insight MI300X,顯示出在AI領(lǐng)域的實(shí)力。但此時(shí)此刻,也許壓力又來(lái)到了AMD這邊。
就問(wèn)AMD,怕不怕?