近日,中國(guó)AI領(lǐng)域的新星DeepSeek宣布了一項(xiàng)重大突破,該公司推出了一套全新的多模式AI模型,據(jù)稱性能已超越OpenAI的DALL-E 3。這一消息在國(guó)際科技界引起了廣泛關(guān)注。
DeepSeek此次發(fā)布的模型系列名為Janus-Pro,用戶可在AI開發(fā)平臺(tái)Hugging Face上下載這些模型。Janus-Pro系列模型的參數(shù)規(guī)模從10億到70億不等,參數(shù)數(shù)量是衡量模型解決問題能力的重要指標(biāo)之一,通常參數(shù)越多,模型的表現(xiàn)越為出色。
值得注意的是,Janus-Pro模型不僅獲得了MIT許可,允許無限制的商業(yè)使用,而且在技術(shù)層面也展現(xiàn)出了非凡的實(shí)力。DeepSeek將其描述為一種新穎的自回歸框架,能夠同時(shí)實(shí)現(xiàn)圖像分析和圖像創(chuàng)作。在Geneval和DPG-Bench兩大AI評(píng)估基準(zhǔn)上,Janus-Pro系列中的最大型號(hào)Janus-Pro-7B擊敗了包括DALL-E 3、PixArt-alpha、Emu3-Gen以及Stability AI的Stable Diffusion XL在內(nèi)的多個(gè)知名模型。
盡管部分對(duì)比模型相對(duì)較舊,且Janus-Pro系列中多數(shù)型號(hào)僅能處理分辨率最高為384x384的小圖像,但考慮到其緊湊的尺寸,Janus-Pro所展現(xiàn)出的性能依然令人驚嘆。DeepSeek在Hugging Face上發(fā)布的一篇文章中自豪地宣稱,Janus-Pro不僅超越了之前的統(tǒng)一模型,甚至在某些方面達(dá)到了甚至超過了特定任務(wù)模型的性能水平。
DeepSeek展示了Janus-Pro模型的圖像輸出,進(jìn)一步證明了其技術(shù)的先進(jìn)性。DeepSeek表示,Janus-Pro憑借其簡(jiǎn)單性、高靈活性和有效性,已成為下一代統(tǒng)一多模態(tài)模型的有力競(jìng)爭(zhēng)者。
在與競(jìng)爭(zhēng)對(duì)手的對(duì)比圖中,Janus-Pro的優(yōu)勢(shì)一目了然。這一突破不僅鞏固了DeepSeek在AI領(lǐng)域的地位,也引發(fā)了業(yè)界對(duì)于美國(guó)能否在人工智能競(jìng)賽中保持領(lǐng)先地位的廣泛討論。
DeepSeek是一家由中國(guó)量化交易公司High-Flyer Capital Management資助的人工智能實(shí)驗(yàn)室。近期,該公司的聊天機(jī)器人應(yīng)用程序在Apple App Store排行榜上登頂,進(jìn)一步提升了其知名度。DeepSeek的語言模型采用了高效的計(jì)算技術(shù)進(jìn)行訓(xùn)練,這一創(chuàng)新之舉讓許多華爾街分析師和技術(shù)專家開始重新審視人工智能芯片的需求以及未來的競(jìng)爭(zhēng)格局。