近日,科技界迎來了一場震撼人心的AI競賽,主角分別是埃隆·馬斯克旗下的xAI公司推出的Grok3大模型,以及中國AI企業DeepSeek所發布的一項突破性技術——NSA。
在一場備受矚目的發布會上,馬斯克自信滿滿地宣布,Grok3是全球最聰明的AI大模型。這一斷言并非空穴來風,從各類測試數據來看,Grok3的表現確實令人矚目,其得分超越了OpenAI和DeepSeek等競爭對手。Grok3之所以能有如此卓越的表現,很大程度上得益于其強大的算力支持——20萬張H100顯卡的堆疊,使其成為了全球算力巔峰的大模型之一。
馬斯克的這一壯舉似乎再次印證了規模定律的有效性,即通過不斷增加算力投入,AI大模型的性能也將隨之提升。然而,就在Grok3發布僅僅一天之后,DeepSeek就拋出了一個重磅炸彈——NSA技術。
DeepSeek在社交平臺上發布了一篇關于NSA的純技術論文報告,詳細介紹了這一與硬件高度適配并可原生訓練的稀疏注意力機制。NSA不僅能夠實現超高速長上下文訓練與推理,更重要的是,它通過優化現代硬件設計,降低了預訓練的成本,同時保持了卓越的性能。這意味著,NSA無需像Grok3那樣堆砌大量顯卡,就能實現對其他AI模型的超越。
DeepSeek的NSA技術,延續了其一貫的低成本高效策略。相比之下,Grok3和OpenAI等競爭對手則更加注重算力的堆砌,試圖通過大力投入來實現性能的提升。然而,DeepSeek的NSA技術打破了這一常規,證明了在AI領域,智慧和創新同樣重要,甚至可能超越單純的算力競爭。
這一突破性進展讓美國的AI公司措手不及。原本,他們以為通過限制中國獲得先進的AI芯片,就能保持自己在AI模型上的領先地位。然而,DeepSeek的NSA技術卻打破了這一幻想,證明了中國AI企業無需依賴大量顯卡,也能實現更強的性能和更好的用戶體驗。
更重要的是,NSA技術的出現打破了美國在算力方面的壟斷地位。這一變革不僅可能重塑整個AI芯片格局,還可能引發AI領域的新一輪創新和競爭。
如今,AI領域的競爭已經不僅僅是算力的比拼,更是智慧和創新的較量。DeepSeek的NSA技術無疑為這場競賽注入了新的活力,也讓人們看到了AI未來的無限可能。