近期,據國際媒體報道,英偉達H20芯片在中國內地的供應問題對DeepSeek-R2 AI模型的研發進程產生了連鎖反應。據悉,這一短缺現象源于美國當局的策略調整,直接影響了DeepSeek團隊的技術開發進度。
DeepSeek在構建其R1模型時,曾動用了大量高性能GPU,其中H20芯片占據了顯著位置。具體來說,為了訓練R1模型,DeepSeek共使用了5萬塊Hopper GPU,包括3萬塊H20、1萬塊H800和1萬塊H100,而這些顯卡的采購工作均由其投資方高毅資產負責完成。
據兩位內部人士透露,DeepSeek團隊近期一直在緊鑼密鼓地推進R2模型的研發工作。然而,盡管付出了巨大努力,CEO梁文鋒對當前模型的表現仍持保留態度,認為性能仍有提升空間。因此,R2模型尚未達到正式投入使用的標準。
報道還指出,當前多數用戶都在依賴英偉達的H20芯片來部署和運行DeepSeek-R1模型。然而,隨著H20芯片受到美國出口限制的影響,DeepSeek R2的研發工作面臨了更大的挑戰。同時,這一限制措施也對現有DeepSeek-R1模型的實際應用造成了一定程度的困擾。