近日,科技界迎來(lái)了一場(chǎng)震撼性的變革,由中國(guó)DeepSeek公司發(fā)布的R1模型,對(duì)美國(guó)AI領(lǐng)域的領(lǐng)先地位構(gòu)成了前所未有的挑戰(zhàn)。這款模型不僅以極具競(jìng)爭(zhēng)力的價(jià)格超越了多個(gè)美國(guó)頂尖模型,還選擇了完全開(kāi)源的路徑,這一舉動(dòng)引發(fā)了業(yè)界的廣泛關(guān)注和討論。
據(jù)透露,美國(guó)meta公司的員工甚至表示,R1模型的發(fā)布讓他們感到恐慌。這種情緒在本周一的美股市場(chǎng)上得到了體現(xiàn),尤其是半導(dǎo)體板塊,股價(jià)普遍遭遇重挫。其中,英偉達(dá)公司的股價(jià)表現(xiàn)尤為引人注目,周一收跌16.79%,市值一夜之間蒸發(fā)了約5900億美元,創(chuàng)下了美國(guó)金融史上的新紀(jì)錄。
除英偉達(dá)外,臺(tái)積電、ARM、阿斯麥以及美光科技等半導(dǎo)體行業(yè)巨頭也未能幸免,股價(jià)均出現(xiàn)大幅下跌。美股三大指數(shù)收盤(pán)時(shí)漲跌不一,道指微漲0.65%,而標(biāo)普500指數(shù)和納指則分別下跌1.46%和3.07%。
面對(duì)DeepSeek帶來(lái)的沖擊,英偉達(dá)發(fā)言人于27日發(fā)表評(píng)論稱(chēng),DeepSeek是一項(xiàng)杰出的人工智能進(jìn)步,是測(cè)試時(shí)間縮放的完美典范。他還指出,DeepSeek的工作展示了如何利用該技術(shù)創(chuàng)建新模型,同時(shí)充分利用廣泛可用的模型和符合出口管制的計(jì)算資源。
然而,DeepSeek并未止步于此。在1月28日凌晨,該公司又發(fā)布了名為Janus-Pro和JanusFlow的一系列開(kāi)源多模態(tài)AI模型。據(jù)DeepSeek介紹,Janus-Pro是JanusFlow大模型的高級(jí)版本,在訓(xùn)練策略、訓(xùn)練數(shù)據(jù)以及模型規(guī)模上均進(jìn)行了優(yōu)化。這款模型在多模態(tài)理解和文本到圖像的指令功能方面取得了重大突破,還顯著增強(qiáng)了文本到圖像生成的穩(wěn)定性。
在文生圖領(lǐng)域的基準(zhǔn)測(cè)試中,Janus-Pro-7B的表現(xiàn)尤為亮眼。在Geneval和DPG-Bench兩項(xiàng)測(cè)試中,其準(zhǔn)確率分別高達(dá)80%和84.2%,遠(yuǎn)超包括OpenAI DALL-E 3在內(nèi)的其他對(duì)比模型。這一成果標(biāo)志著DeepSeek正式進(jìn)軍文生圖領(lǐng)域,為AI技術(shù)的發(fā)展開(kāi)辟了新的方向。
DeepSeek的R1模型之所以能夠引發(fā)如此大的轟動(dòng),主要得益于其在A(yíng)I技術(shù)上的突破以及對(duì)美國(guó)科技巨頭地位的撼動(dòng)。長(zhǎng)期以來(lái),美國(guó)科技公司在A(yíng)I大模型領(lǐng)域一直處于領(lǐng)先地位,而中國(guó)科技公司則被視為追趕者。然而,DeepSeek的R1模型在第三方測(cè)試中表現(xiàn)優(yōu)異,打破了這一固有印象。
在當(dāng)前美國(guó)對(duì)中國(guó)實(shí)施制裁、中國(guó)公司無(wú)法使用高端芯片的背景下,DeepSeek仍然能夠開(kāi)發(fā)出領(lǐng)先模型,這一成就更顯得尤為珍貴。這不僅說(shuō)明當(dāng)前AI大模型所需的算力資源可能被高估,也為其他科技公司提供了新的啟示:在有限條件下,通過(guò)技術(shù)優(yōu)化同樣可以進(jìn)行AI研發(fā)。
DeepSeek的創(chuàng)始人梁文鋒在接受采訪(fǎng)時(shí)曾表示,中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置。他認(rèn)為,中國(guó)AI與美國(guó)之間的差距主要在于原創(chuàng)與模仿之間的差異。為了改變這一現(xiàn)狀,中國(guó)必須有人站到技術(shù)的前沿,進(jìn)行原創(chuàng)性的探索和研究。DeepSeek的成就正是這一理念的生動(dòng)體現(xiàn)。