在AI領域的全球版圖上,一家名為深度求索(DeepSeek)的中國企業正以其卓越的創造力引發廣泛關注。近日,這家總部位于杭州的公司憑借其最新發布的推理模型R1,在歐美AI界掀起了一場不小的波瀾。
美國知名財經媒體CNBC在報道中指出,DeepSeek的AI模型對美國的AI主導地位構成了威脅。與此同時,華爾街頂級風投機構A16Z的創始人馬克·安德森也在社交媒體上高度贊揚了DeepSeek R1,稱其為最令人驚嘆的突破之一,并且是開源的,是對世界的饋贈。英偉達公司的資深科學家Jim Fan同樣對DeepSeek給予了高度評價。
據媒體報道,社交媒體巨頭meta的員工在匿名職場社區上透露,DeepSeek的近期動態讓meta的生成式AI團隊感到恐慌,工程師們正急于分析DeepSeek,希望從中復制任何有價值的技術。此前,OpenAI前政策主管、Anthropic聯合創始人杰克·克拉克也曾表示,DeepSeek擁有一支才華橫溢的團隊,并認為中國制造的大模型將成為一股不可忽視的力量。國外多家科技博客也紛紛對DeepSeek進行了詳盡的報道。
那么,這家讓歐美科技界和創投圈大佬及媒體紛紛稱贊的中國大模型公司,究竟有何過人之處呢?
DeepSeek近日發布的推理模型R1,在性能上已逼近OpenAI的o1正式版,但推理成本卻僅為后者的幾十分之一。紐約時報指出,DeepSeek以極低的成本(600萬美元)和少量的芯片(2000塊)實現了與OpenAI等巨頭相媲美的性能,打破了“只有科技巨頭才能研發尖端AI”的行業慣例。
DeepSeek的這一創新不僅降低了研發成本,更提升了用戶體驗。R1功能強大且完全免費,同時還向開發者開源了代碼。許多網友紛紛表示,DeepSeek的模型在寫代碼方面表現甚至優于GPT,且使用成本更低。記者親身體驗發現,只需登錄DeepSeek的官網或手機APP,即可通過“深度思考”功能感受R1的強大能力。
在與DeepSeek的對話中,記者提出了關于DeepSeek R1模型發布與英偉達股價下跌之間關系的問題。DeepSeek從多個維度進行了邏輯嚴密的分析,并圍繞技術趨勢、市場情緒與預期管理、行業生態等方面給出了精要的闡述和結論。在使用過程中,R1不僅能夠用動畫解釋復雜的量子力學,還能輕松應對腦筋急轉彎,以及用縝密的邏輯回答各種難題。
據了解,DeepSeek R1并未采用業內普遍使用的監督微調(SFT)訓練范式,而是通過強化學習讓模型自主進化出復雜的推理能力,包括反思和長鏈思考等。這種方法不僅提高了訓練效率,還顯著降低了對昂貴計算資源的依賴。與OpenAI的o1相比,DeepSeek模型的百萬token輸入成本從15美元降至0.55美元,輸出成本也從60美元降低到2美元。
DeepSeek的創新成果甚至被一些股民視為芯片巨頭英偉達股價下跌的原因之一。有人提出,DeepSeek正是在美國對華進行芯片出口限制的背景下激發出的創新力量。業內人士認為,DeepSeek的出現標志著中國AI產業正從“跟隨創新”向“范式創新”轉變,全球AI競爭也進入了技術多極化的新時代。