DeepSeek熱潮下，大模型算力需求如何被重構(gòu)？-魔扣目錄

在DeepSeek掀起的技術(shù)風(fēng)暴中，一個(gè)廣泛流傳的觀(guān)點(diǎn)認(rèn)為大模型的算力需求或許正面臨泡沫，存在過(guò)剩風(fēng)險(xiǎn)。然而，深入分析這一現(xiàn)象，我們發(fā)現(xiàn)事實(shí)遠(yuǎn)非如此簡(jiǎn)單。

DeepSeek-V3和R1模型的橫空出世，打破了“算力即霸權(quán)，規(guī)模即壁壘”的行業(yè)信條。DeepSeek以不到行業(yè)平均十分之一的成本，訓(xùn)練出了效果卓越的大模型，這無(wú)疑引發(fā)了對(duì)算力邏輯的深刻反思。英偉達(dá)等傳統(tǒng)算力巨頭的股價(jià)因此受挫，市場(chǎng)擔(dān)憂(yōu)算力需求下滑；而國(guó)產(chǎn)算力企業(yè)如海光信息、華為昇騰等，因成功適配DeepSeek模型，股價(jià)飆升或備受矚目。

這一分化現(xiàn)象揭示了業(yè)界對(duì)算力認(rèn)知的轉(zhuǎn)變，從過(guò)去的“規(guī)模至上”轉(zhuǎn)變?yōu)椤靶蕛?yōu)先”。然而，算力需求的本質(zhì)并未消失，而是以更加復(fù)雜的形式重塑。DeepSeek的貢獻(xiàn)不僅在于算法優(yōu)化，更在于它大大降低了大模型的門(mén)檻，推動(dòng)了大模型能力的普及。

以往，具備相同能力的大模型要么效果不佳，要么采取閉源收費(fèi)策略，如GPT-4o。DeepSeek的出現(xiàn)迫使這些模型改變策略。同時(shí)，DeepSeek的低成本也激發(fā)了更多用戶(hù)嘗試大模型的熱情。中信建投指出，DeepSeek R1之所以能以較少的算力實(shí)現(xiàn)高性能，關(guān)鍵在于其算法、框架和硬件的協(xié)同優(yōu)化。

DeepSeek R1在算法層面引入了專(zhuān)家混合模型、多頭隱式注意力、多token預(yù)測(cè)等技術(shù)；在框架層面實(shí)現(xiàn)了FP8混合精度訓(xùn)練；在硬件層面則采用了優(yōu)化的流水線(xiàn)并行策略，并高效配置了專(zhuān)家分發(fā)與跨節(jié)點(diǎn)通信。當(dāng)前，大模型行業(yè)正處于從生成式模型向深度推理模型過(guò)渡的階段，算力需求也從預(yù)訓(xùn)練階段逐步轉(zhuǎn)向后訓(xùn)練和推理側(cè)。DeepSeek R1通過(guò)協(xié)同優(yōu)化，在特定階段實(shí)現(xiàn)了高效算力利用，算力行業(yè)的長(zhǎng)期增長(zhǎng)邏輯依然穩(wěn)固。

雖然單一模型的訓(xùn)練和推理算力需求在下降，但由此帶來(lái)的技術(shù)普及卻催生了更大的算力需求。一方面，基礎(chǔ)大模型的競(jìng)爭(zhēng)依然激烈，字節(jié)跳動(dòng)、阿里巴巴等頭部玩家仍在加碼預(yù)訓(xùn)練，高端算力需求持續(xù)增長(zhǎng)。另一方面，AI應(yīng)用的普及推動(dòng)了推理算力的需求激增。DeepSeek的全球日活用戶(hù)迅速增長(zhǎng)，盡管單個(gè)模型推理成本降低，但用戶(hù)規(guī)模和場(chǎng)景復(fù)雜度的擴(kuò)張使得整體算力消耗不減反增。

這一現(xiàn)象與經(jīng)濟(jì)學(xué)家威廉·斯坦利·杰文斯提出的“杰文斯悖論”不謀而合。該悖論指出，當(dāng)技術(shù)進(jìn)步提高效率時(shí)，資源消耗往往會(huì)激增。如今，AI算力支撐大模型的效率更高，但算力需求也進(jìn)入了新一輪上升周期。DeepSeek的開(kāi)源戰(zhàn)略推動(dòng)了其模型在教育、醫(yī)療、金融等領(lǐng)域的快速滲透，AI應(yīng)用遍地開(kāi)花。

例如，DeepSeek的視覺(jué)語(yǔ)言融合模型DeepSeek-VL2在工業(yè)質(zhì)檢中需要實(shí)時(shí)處理高分辨率圖像數(shù)據(jù)；代碼生成模型DeepSeek-Coder則需要支撐全球開(kāi)發(fā)者的高頻調(diào)用。這些場(chǎng)景對(duì)低延遲、高并發(fā)的需求迫使算力基礎(chǔ)設(shè)施持續(xù)升級(jí)。某電商平臺(tái)引入DeepSeek后，日均處理咨詢(xún)量大幅提升，GPU集群規(guī)模也相應(yīng)擴(kuò)容。

DeepSeek的崛起無(wú)疑為中國(guó)AI產(chǎn)業(yè)注入了一劑強(qiáng)心針。國(guó)產(chǎn)AI算力廠(chǎng)商紛紛宣布適配DeepSeek，包括昇騰、海光、壁仞科技等多家企業(yè)。然而，在國(guó)產(chǎn)芯片融合方面，DeepSeek與其他國(guó)內(nèi)大模型并無(wú)本質(zhì)區(qū)別，其訓(xùn)練和推理在很大程度上依然依賴(lài)于英偉達(dá)GPU。國(guó)產(chǎn)AI芯片廠(chǎng)商要走出自己的路，關(guān)鍵在于底層架構(gòu)要符合市場(chǎng)，上層軟件要整體適用，并具備足夠的標(biāo)準(zhǔn)化和開(kāi)放性。

未來(lái)算力競(jìng)爭(zhēng)將呈現(xiàn)三大趨勢(shì)：一是效率競(jìng)賽轉(zhuǎn)向場(chǎng)景戰(zhàn)爭(zhēng)，誰(shuí)能更低成本激活邊緣場(chǎng)景，誰(shuí)將主導(dǎo)市場(chǎng)；二是硬件霸權(quán)讓位于架構(gòu)主權(quán)，模型定義硬件的能力比芯片制程更重要；三是國(guó)產(chǎn)替代升級(jí)為全球規(guī)則，中國(guó)通過(guò)DeepSeek驗(yàn)證的軟硬協(xié)同路徑，或?qū)⒊蔀槿駻I算力新范式。

DeepSeek讓我們更加清晰地認(rèn)識(shí)到，在智能時(shí)代，最關(guān)鍵的資源或許不是芯片，而是人的創(chuàng)造力。隨著DeepSeek等先進(jìn)模型的影響，硬件生態(tài)系統(tǒng)能否趨于統(tǒng)一和標(biāo)準(zhǔn)化，將是一個(gè)值得期待的問(wèn)題。

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

DeepSeek熱潮下，大模型算力需求如何被重構(gòu)？

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

答題星2018-06-03

全階人生考試2018-06-03

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

每日養(yǎng)生app2018-06-03

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03