在剛剛過去的春節假期,一款名為DeepSeek的中國國產大模型意外走紅,成為了科技領域的話題焦點。這款大模型不僅引起了業界的廣泛關注,還深入到了普通人的生活與工作中。
DeepSeek的發布可以追溯到1月20日,由中國大模型公司深度求索推出其推理大模型DeepSeek-R1。該模型的發布迅速在業界引起了轟動,僅僅一周后的1月27日,DeepSeek應用便成功登頂蘋果中國區和美國區應用商店的免費App下載排行榜。緊接著,在1月31日,美國科技巨頭英偉達、亞馬遜和微軟在同一天宣布接入DeepSeek-R1,進一步彰顯了其影響力。
DeepSeek的成功不僅僅是AI領域的一次突破,更是一次破圈現象。它不僅在技術上達到了國際先進水平,更重要的是,其可用程度和完成度極高,引發了廣泛的討論,從而吸引了眾多普通人的關注。這款大模型的出現,讓AI技術更加貼近人們的生活,成為了他們日常工作和生活的一部分。
DeepSeek的成功也體現了國產大模型的能力。它不僅展示了中國AI技術的實力,還有望追趕甚至反超世界先進水平。DeepSeek還大幅降低了AI模型的訓練成本。據悉,其R1模型的訓練成本僅為557.6萬美元,相比之下,OpenAI的GPT模型訓練成本則高達1億美元。
面對DeepSeek所取得的成就和業界的廣泛贊譽,深度求索(DeepSeek)的創始人梁文鋒卻表現得十分謙遜。他表示:“我們不過是站在開源社區巨人們的肩膀上,給國產大模型這棟大廈多擰了幾顆螺絲?!绷何匿h所提到的“巨人”——開源社區,即開放源代碼,它允許用戶利用源代碼進行修改和學習,為技術的發展提供了巨大的推動力。
開源策略不僅具有世界大同的美好愿景,同時也承載著利益動機。通過開源,可以吸引全球開發者和研究者的關注,形成一個強大的技術社區。這個社區具備敏捷性和協作優勢,能夠形成“技術共享-生態繁榮-反哺創新”的正向循環。因此,在競爭中處于弱勢的一方往往會選擇開源策略來扭轉局勢。在計算機行業中,一個封閉的生態往往對應著一個開放的、開源的生態。
如今,開源已經成為AI迅猛發展的助推劑。meta首席人工智能科學家、2018年圖靈獎得主楊立昆在評價DeepSeek時指出:“與其說是中國在人工智能上超越美國,不如說是開源代碼正在超越私有模式。DeepSeek從開放研究和開放源碼中受益良多,例如meta的PyTorch和LLaMA等項目。”
實際上,meta在推動AI大模型開源方面發揮了重要作用。從LLaMA大模型到圖像分割模型Segment-Anything,meta開源的項目覆蓋了各種模態和場景。其中,LLaMA是最強大的開源大模型之一。2023年7月,meta發布的LLaMA2更是將開源協議從“僅研究可用”轉向“免費可商用”,雖然催生了一大批“套殼大模型”,但也改變了大模型競爭中OpenAI獨占鰲頭的格局。在這些開源大模型中,DeepSeek無疑是最強大的之一。
DeepSeek的成功驗證了開源模型可以接近甚至達到閉源性能的水平,這反過來將促使meta等巨頭加大對開源AI的投入。最近,meta又開源了多個AI項目,包括圖像分割模型SAM 2.1、多模態語言模型Spirit LM等,進一步提升了AI在圖像處理和語音識別領域的能力。
然而,盡管開源促進了AI的迅猛發展,但我們也應該看到其中的隱憂。開源的本質是用開放促效率,但在當今世界,效率在很多時候已經不再是第一位的考慮。AI技術是由軟硬件兩方面構成的,在硬件逐漸走向封閉的同時,軟件的開源是否也會走向封閉?這是一個值得中國AI界深思的問題。因此,我們需要提前做好應對之策,用創新和開放來回應封閉的挑戰,正如DeepSeek所做的那樣。