埃隆·馬斯克的人工智能企業(yè)xAI近日宣布了一項雄心勃勃的計劃,即在美國田納西州的孟菲斯市建造一臺規(guī)模空前的超級計算機。據(jù)內(nèi)部文件透露,該公司正斥資數(shù)億美元推進這一項目,然而,一個巨大的挑戰(zhàn)正擺在他們面前——電力供應(yīng)不足。
自2024年6月項目公開以來,xAI已向孟菲斯規(guī)劃與發(fā)展機構(gòu)提交了多達14份建筑許可證申請,涉及電氣、機械、管道等多個工程領(lǐng)域,預(yù)估總成本高達4.059億美元。其中,一項價值3000萬美元的工程專門用于計算機設(shè)備的安裝,另一項390萬美元的工程則是建造防撞圍欄。
馬斯克曾表示,他希望將孟菲斯超級計算機Colossus的規(guī)模擴大十倍,以容納100萬個GPU。然而,根據(jù)文件顯示,xAI無法從當?shù)仉娋W(wǎng)獲得足夠的電力來支持這一龐大的計算需求。除非xAI能夠在項目現(xiàn)場自行建設(shè)發(fā)電設(shè)施,否則他們將面臨電力短缺的困境。
為了應(yīng)對這一挑戰(zhàn),xAI已經(jīng)向孟菲斯照明、天然氣和水處理公司(MLGW)申請了300兆瓦的電網(wǎng)電力,并成功獲得了150兆瓦的供電許可。同時,xAI還在考慮在超級計算機項目現(xiàn)場安裝天然氣渦輪機來發(fā)電。不過,xAI表示,能否全部使用300兆瓦的電網(wǎng)電力還取決于該地區(qū)的基礎(chǔ)設(shè)施升級和輸電網(wǎng)絡(luò)的改善。
目前,xAI正在使用卡特彼勒子公司Solar Turbines的燃氣發(fā)電機來補充電力供應(yīng),這些發(fā)電機的總發(fā)電能力為250兆瓦。然而,即使有了這些額外的電力供應(yīng),xAI仍然難以滿足其龐大的計算需求。在許可申請中,xAI明確表示:“如果沒有額外的現(xiàn)場發(fā)電,我們無法滿足客戶需求。”
田納西河谷管理局(TVA)負責為田納西州大部分地區(qū)及周邊六個州的部分地區(qū)供電。面對xAI等企業(yè)的電力需求增長,TVA在今年2月表示,計劃在未來幾年投資160億美元來滿足歷史性的負荷增長。然而,TVA的發(fā)言人表示,其董事會需要審查并批準任何超過100兆瓦的新負荷,以確保電力系統(tǒng)的可靠性得以維持。
加州大學河濱分校電氣與計算機工程副教授任紹磊認為,憑借自主現(xiàn)場發(fā)電能力,xAI可能能夠為一定數(shù)量的英偉達H100 GPU提供電力。然而,如果xAI想要進一步擴大算力,將面臨巨大的挑戰(zhàn)。根據(jù)任紹磊的計算,運行100萬個GPU可能需要超過1千兆瓦的電力,這是xAI目前在孟菲斯可獲得電力的四倍。