近期,中國AI技術公司DeepSeek推出的AI大模型在全球范圍內引發了轟動。起初,眾多國際科技巨頭對DeepSeek的技術持懷疑態度,但隨著時間的推移,這些大廠紛紛轉變立場,開始積極支持DeepSeek的模型。
DeepSeek推出的V3和R1兩款開源AI模型,徹底顛覆了業界對于AI算力需求的傳統認知。特別是其推理大模型DeepSeek-R1,不僅在性能上與OpenAI的GPT模型不相上下,而且所需的訓練成本僅為后者的約二十分之一。據悉,V3模型僅使用了2048個H800 GPU,在兩個月的訓練周期內便完成了全部工作,總花費約為558萬美元。DeepSeek-R1的API定價也極具競爭力,僅為OpenAI模型的約二十八分之一,使用成本降低了約97%。
DeepSeek采用并不先進的AI芯片,卻以更低的算力要求和成本,實現了與美國頂級AI大模型相當的效果。這一成就不僅引發了美國AI技術廠商的恐慌,如OpenAI、微軟、meta和谷歌等,還導致AI芯片企業如英偉達等的價值重估和股價波動。面對DeepSeek的崛起,OpenAI和微軟曾一度懷疑DeepSeek可能對其模型進行了不當的“蒸餾”。蒸餾是一種技術,可以將大型模型的知識轉移到較小模型中。然而,DeepSeek隨后獲得了業界的廣泛認可。
OpenAI的首席執行官奧爾特曼公開承認,DeepSeek確實是一個出色的模型,并表示OpenAI雖然會繼續努力開發更好的模型,但未來的領先優勢將不會像以往那樣顯著。他還透露,OpenAI正在討論新的開源策略,并承認在DeepSeek的問題上,公司可能站錯了隊。
與此同時,亞馬遜AWS、微軟Azure、阿里云等頭部云服務大廠紛紛上線了基于DeepSeek-R1模型的云服務。用戶可以在這些平臺上輕松部署和調用DeepSeek-R1模型,享受高質量的服務和支持。英偉達、英特爾、AMD等AI芯片廠商也宣布了對DeepSeek模型的支持,進一步擴大了DeepSeek的應用生態。
從1月30日起,亞馬遜AWS允許用戶在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。隨后,微軟也宣布DeepSeek-R1已在Azure AI Foundry和GitHub上提供。華為云、騰訊云、百度智能云和阿里云等也相繼宣布了對DeepSeek模型的支持,并推出了超低價格方案及限時免費服務。
字節跳動旗下的火山引擎也全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。企業用戶可以在火山引擎機器學習平臺veMLP中部署或通過火山方舟平臺直接調用這些模型。京東云也正式上線了DeepSeek-R1和DeepSeek-V3模型,支持公有云在線部署和專混私有化實例部署兩種模式。
在芯片領域,英偉達、AMD和英特爾等大廠也迅速完成了對DeepSeek大模型的適配。英偉達宣布DeepSeek-R1模型已登陸NVIDIA NIM,并在單個英偉達HGX H200系統上實現了驚人的處理速度。AMD則將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,針對AI推理進行了優化。英特爾也在其最新發布的酷睿Ultra 200H平臺的AI PC上實現了對DeepSeek-R1-1.5B模型的本地支持。
在應用生態方面,盛天網絡、萬興科技、易點天下和當虹科技等多家企業已完成了對DeepSeek模型的對接和適配工作。這些企業計劃將DeepSeek模型應用于其社交產品、視頻編輯軟件、智能營銷平臺和視聽大模型等多個領域,以探索更優質的產品與服務,并結合彈性算力池有效降低算力成本。