在人工智能領域,一場前所未有的熱潮正席卷全球。1月27日,一款名為DeepSeek的應用成功登上蘋果中國與美國地區應用商店免費APP下載排行榜榜首,這一壯舉不僅超越了ChatGPT在美區的地位,也力壓豆包、抖音等國內熱門應用,成為業界矚目的焦點。
對于AI行業而言,DeepSeek的登頂無疑是一個歷史性的時刻。它標志著首款AI助手類產品成功超越了ChatGPT,同時也意味著中國企業研發的生成式AI應用產品首次登頂美區蘋果App Store。DeepSeek由國產大模型公司深度求索推出,隸屬于量化巨頭幻方量化旗下。自1月20日深度求索正式發布推理大模型DeepSeek-R1以來,憑借其高性價比的特性,在海外開發者社區中引發了巨大轟動。
DeepSeek-R1作為一款開源模型,其性能在數學、代碼、自然語言推理等任務上能夠比肩OpenAI的GPT系列模型,并采用MIT許可協議,支持免費商用、任意修改和衍生開發等。在國外大模型排名榜Chatbot Arena上,DeepSeek-R1的基準測試排名迅速攀升至全類別大模型第三,與OpenAI的ChatGPT-4并列,同時在風格控制類模型分類中與OpenAI的GPT系列模型并列第一。更令人驚訝的是,DeepSeek-R1的預訓練費用僅為557.6萬美元,在2048塊英偉達H800 GPU集群上運行55天完成,這一成本僅為OpenAI GPT-4模型訓練成本的十分之一左右。
DeepSeek的高效背后,離不開其核心技術因素的支持,包括低精度計算、小參數量和高質量數據等。據DeepSeek的技術文檔透露,該模型使用數據蒸餾技術生成的高質量數據,極大地提升了訓練效率。數據蒸餾通過一系列算法和策略,將原始的、復雜的數據進行去噪、降維、提煉等操作,從而得到更為精煉、有用的數據。
目前,DeepSeek R1模型每百萬個token的查詢成本僅為0.14美元,而OpenAI的成本則高達7.50美元,便宜了98%。這一巨大的價格優勢,讓華爾街算力板塊的投資人感受到了前所未有的壓力。然而,就在DeepSeek風頭正勁之時,其網頁/API卻出現了不可用的情況,目前正在調查原因。此前,DeepSeek也曾出現過短時閃崩現象,公司回應稱可能與服務維護、請求限制等因素有關。
對于同時登頂中美App Store應用榜單這一壯舉,DeepSeek團隊表達了無比的振奮和感激。他們表示,這一成就不僅是對技術實力的認可,更是全球用戶和開發者社區對他們的信任與支持的直接體現。DeepSeek團隊的感言中提到了三個核心觸動:技術民主化的勝利、用戶信任的托舉以及開放生態的裂變。他們堅信,當技術突破與人文關懷共振時,冰冷的代碼也能綻放溫暖的價值。
業內專家對DeepSeek的登頂也給予了高度評價。金沙江創業投資基金主管合伙人朱嘯虎認為,DeepSeek的勝利是技術理想主義者的勝利,專注于技術和創新遠勝于投放買流量和公關。英偉達高級研究科學家Jim Fan則表示,DeepSeek-R1可能是首個展示了強化學習飛輪可以發揮作用且能帶來持續增長的開源軟件項目。AI科技初創公司Scale AI創始人亞歷山大·王則強調,DeepSeek的AI大模型發布可能會改變美國一直領先于中國的人工智能競賽的格局。
DeepSeek的開源模型還引發了一股“復現熱潮”。例如,HuggingFace在GitHub上發起的Open R1項目,完全復制和開源了DeepSeek R1,包括訓練數據、訓練腳本等。面對DeepSeek的挑戰,meta也迅速采取行動,組建了多個小組來研究DeepSeek的技術細節,并希望在其即將發布的Llama 4中實現技術突破。
然而,DeepSeek的沖擊也引發了全球算力市場的動蕩。A股寒武紀股價持續走低,日本半導體股也出現下挫,美股納指期貨更是領跌。業內人士表示,DeepSeek可能引發科技股下跌,因為大型科技公司在AI上投入了大量資金,但一直存在投資回報能否匹配的問題。分析師也指出,中國的DeepSeek可能代表了對美國股市最大的威脅,因為其以極低的價格建立了一個突破性的人工智能模型,而無需依賴最先進的芯片。
盡管如此,DeepSeek的成就仍然讓業界看到了技術平權與知識信息平權的曙光。正如DeepSeek團隊所言,他們正在見證一個新時代的開端——這里沒有孤勇的英雄,只有無數雙手共同推開未來之門。