在剛剛過去的春節期間,全球科技界迎來了一場前所未有的風暴,名為DeepSeek的人工智能模型迅速走紅,引發廣泛討論。中國A股市場中的DeepSeek概念股,如每日互動、青云科技、安恒信息及天娛數科等,在春節后的兩個交易日內,紛紛迎來了連續的漲停板。
DeepSeek之所以能在短時間內引起如此大的反響,關鍵在于它顛覆了以往大模型領域內盛行的“算力論”。DeepSeek以實際行動證明,模型的能力與訓練成本之間,并非必然存在正相關關系。這一發現,無疑給整個AI行業帶來了巨大的震動。
根據公布的數據,DeepSeek-V3的訓練成本僅為Llama 3的百分之一,而DeepSeek-R1的推理成本也只有OpenAI o1的三分之一。這一顯著的成本優勢,使得DeepSeek迅速成為了華爾街的“黑天鵝”,導致算力領域的領頭羊英偉達及眾多美股科技股在恐慌中暴跌。
1月27日,DeepSeek在中國區及美國區的蘋果App Store免費榜上同時登頂。這一消息傳出后,當晚開盤的美國科技股集體大跌,其中費城半導體指數(SOX)下跌9.2%,創下了自2020年3月以來的最大跌幅。英偉達股價更是暴跌近17%,市值蒸發近6000億美元,創下了美股史上的最大市值蒸發紀錄。
DeepSeek所展現出的核心競爭力,除了低成本和高效的推理能力外,更重要的是其開源模型的能力已經逼近甚至在某些測試中超越了最新的閉源模型。DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等多項測試中,得分與代表了當前最高水平的閉源模型o1正式版相近,甚至在部分測試中超過了o1。
meta的首席AI科學家Yann Lecun認為,DeepSeek-R1的面世,并非是中國AI技術戰勝了美國,而是開源模式的一次重大勝利。從技術層面來看,R1模型摒棄了RLHF中的HF(人類反饋)部分,僅保留了RL(強化學習)部分,這一改變使得模型具備了反思能力。英偉達的高級研究科學家Jim Fan也指出,DeepSeek-R1可能是首個展示了RL飛輪效應并能帶來持續增長的開源軟件項目。
在開源與閉源的競爭中,閉源模型始終保持水平高于開源模型,這是最基本的競爭門檻。然而,當開源大模型的能力追上甚至超越閉源大模型時,開源模式將對閉源模式造成巨大沖擊。這也是DeepSeek引發美股科技股恐慌的主要原因之一。在DeepSeek的壓力之下,OpenAI也做出了調整,發布了首個向免費用戶開放的推理模型o3-mini,并表示正在考慮改變開源策略。
與此同時,英偉達、亞馬遜和微軟這三大科技巨頭也在同一天宣布接入DeepSeek-R1。DeepSeek在國內外AI界的廣泛認可和快速傳播,使得A股市場中的DeepSeek概念股持續漲停。從產業層面來看,多家券商認為,DeepSeek有望帶動國內AI產業的快速發展,其開源和低成本的特性也將賦能AI應用廠商,加速推動硬件終端AI的落地。
在國產替代的層面,DeepSeek的創新背景是在美國芯片限制下誕生的,這證明了國內AI產業從芯片上游到模型、應用下游的閉環是可實現的。這一創新成果大幅提振了國內AI產業鏈的信心。盡管DeepSeek的出現讓美股市場開始擔憂算力需求見頂及AI資本開支將放緩,但從美國各大廠的最新指引來看,并沒有減少資本開支的跡象。
谷歌、meta和微軟都預計今年的資本開支將遠高于市場預期。微軟雖然由于與OpenAI在AI發展理念上的分歧而減少了對其的追加投資,但并未減少整體的資本開支計劃。長期來看,DeepSeek的路線實際上可能進一步推動GPU需求的增長。微軟首席執行官納德拉引用“杰文斯悖論”指出,提高資源使用效率反而可能增加其總消耗量。DeepSeek帶來的計算成本下降將降低AI應用門檻,應用普及則會刺激上游算力需求的增長。
投行分析師Cantor Fitzgerald也在一份投資報告中指出,擔心GPU支出會達到峰值的觀點并非事實,DeepSeek實際上對計算和英偉達非常有利。多個分析師團隊仍舊看多英偉達。因此,整體來看,DeepSeek沖擊波的最終受害者可能并非英偉達,而是OpenAI等大模型同行。
DeepSeek的出現不僅改變了AI行業的格局,也引發了人們對于開源與閉源、算力需求與資本開支等問題的深入思考。這場由DeepSeek引發的風暴,無疑將在未來一段時間內繼續影響全球科技界的發展。