近期,杭州深度求索人工智能基礎技術研究有限公司,作為DeepSeek的關聯企業,在人工智能領域取得了新突破,公布了一項專利——“一種針對大語言模型的部署方法及系統”。這一專利的發布,彰顯了該公司在人工智能技術研發上的又一里程碑。
該專利聚焦于人工智能的核心技術領域,其獨特之處在于將大語言模型的預填充和解碼兩個階段,分別部署于高性能計算與大內存配置的設備上。這種創新的分布式部署策略,有效平衡了系統負載,實現了硬件資源的最大化利用。通過避免計算資源的閑置,該方法顯著降低了系統延遲,同時大幅提升了吞吐量。
在當前AI技術日新月異的背景下,系統的擴展性和容錯性成為了至關重要的考量因素。DeepSeek的這項專利,通過優化資源配置,顯著增強了系統應對多樣化工作負載的能力。這一創新部署策略,預示著AI模型將更加高效、智能,為各類應用場景提供更加堅實的支持。
DeepSeek的核心產品之一,DeepSeek-V3,憑借其強大的Mixture-of-Experts(MoE)語言模型,擁有高達6710億個參數,每個token的激活參數達到370億個。這一技術上的飛躍,無疑將加速AI技術的普及與應用,為各行各業的數字化轉型注入強勁動力。