在2025年初的科技圈,一個名為DeepSeek的中國AI初創公司引發了全球范圍內的廣泛關注。1月20日,DeepSeek正式推出了其DeepSeek-R1模型,并慷慨地開源了模型權重,這一舉動立即在業界掀起了波瀾。
DeepSeek-R1模型以其低廉的成本和卓越的性能,在眾多第三方測試中脫穎而出,甚至超越了OpenAI的最新模型o1,這一成就不僅震驚了硅谷,也讓meta等科技巨頭內部感到了前所未有的壓力。據報道,meta的工程師們正緊鑼密鼓地嘗試復制DeepSeek的成功經驗。
DeepSeek的出色表現吸引了大量用戶,其服務器幾度因訪問量過大而宕機。更令人矚目的是,DeepSeek在蘋果中國地區和美國地區的應用商店免費App下載排行榜上迅速登頂,并在美區下載榜上超越了ChatGPT,成為了新的熱門應用。
DeepSeek的成就也贏得了國內外眾多大佬的高度評價。微軟首席執行官薩蒂亞·納德拉在世界經濟論壇上稱贊DeepSeek的新模型令人印象深刻,表示中國AI的進步必須被認真對待。谷歌前CEO埃里克·施密特也在節目中改變了美國在AI方面保持領先優勢的看法,他認為中國在過去6個月里以非同尋常的速度迎頭趕上,DeepSeek就是其中的代表之一。
AI科技初創公司Scale AI的創始人亞歷山大·王也公開表示,DeepSeek的AI大模型性能與美國最好的模型相當。著名投資公司A16z的創始人馬克·安德森更是發文稱DeepSeek-R1是他見過的最令人驚嘆的突破之一,而且還是開源的,這是給世界的一份禮物。
不僅如此,DeepSeek還受到了游戲科學創始人馮驥的盛贊,他認為DeepSeek可能是個國運級別的科技成果。金沙江創投的朱嘯虎也稱DeepSeek是技術理想主義者的勝利。
外媒對DeepSeek的報道也絡繹不絕。英國《金融時報》稱中國小型AI初創公司DeepSeek震驚硅谷,Business Insider則指出DeepSeek-R1模型的開源為美國AI玩家帶來了麻煩。CNBC更是推出了長達40分鐘的專題報道,探討DeepSeek對美國AI主導地位的沖擊。
在CNBC的節目中,美國AI初創公司Perplexity的首席執行官Aravind Srinivas分析了DeepSeek對美國AI的影響,并給予了高度評價。他認為,雖然中國在AI競爭中存在硬件資源等劣勢,但由于需求是發明之母,中國團隊找到了許多數值穩定的方法,構建出了更高效的解決方案。DeepSeek-R1模型不僅在API價格上比GPT-4便宜10倍,速度極快,而且在某些基準測試中表現更好。他們用較少的計算資源和預算,做出了如此驚人的模型,并且免費公開了技術論文。
Aravind Srinivas還表示,DeepSeek的創新讓他感到驚訝,他們的技術論文中提出了許多聰明的解決方案,如混合專家模型和8位浮點訓練等。這些創新不僅讓DeepSeek在AI競賽中脫穎而出,也為整個行業帶來了新的啟示。
對于DeepSeek對美國AI生態系統的影響,Aravind Srinivas認為,如果整個美國AI生態系統都依賴于中國的開源模型,那將是非常危險的。但他也表示,美國公司不應該把所有的精力都放在禁止和阻止中國上,而是應該努力超越他們,贏得競爭。他認為meta等美國公司仍然有能力構建出比DeepSeek更好的模型,并將其開源。
DeepSeek的成功不僅改變了AI領域的格局,也引發了人們對大型語言模型商業化的思考。Aravind Srinivas認為,隨著預訓練和后訓練系統的逐漸商業化,今年會有更多的商業化嘗試。推理模型也會經歷類似的軌跡,最初可能只有一兩個玩家知道如何做到,但隨著時間的推移,更多的玩家會加入。