近年來,我國在人工智能技術(shù)領域的進展顯著,多款新發(fā)布的大模型已達到國際頂尖水平,與此同時,AI芯片企業(yè)也積極行動,致力于與各大國產(chǎn)大模型進行適配,共同推動智能計算產(chǎn)業(yè)生態(tài)的構(gòu)建。作為國家級的技術(shù)驗證平臺,中國信息通信研究院通過“人工智能芯片測試評估公共服務平臺”,建立了AI芯片與大模型協(xié)同適配的標準化體系,為產(chǎn)業(yè)鏈上下游的深度合作提供了重要支撐,并積極開展適配驗證工作,通過一系列措施促進了AI芯片與大模型的協(xié)同發(fā)展。
中國信息通信研究院近期宣布,摩爾線程自主研發(fā)的訓推一體計算卡MTT S4000與杭州深度求索人工智能基礎技術(shù)研究有限公司研發(fā)的DeepSeek-R1 671B大模型,在推理場景下的適配結(jié)果已經(jīng)滿足“AI芯片和大模型通過性適配要求”,成功通過中國信通院的《AI芯片和大模型適配能力通過性評測軟硬件環(huán)境及測試細則》推理場景驗證。摩爾線程MTT S4000不僅運行穩(wěn)定,滿足推理使用需求,還獲得了相應的檢測證書。目前,摩爾線程系列訓推一體計算卡正在進一步優(yōu)化性適配驗證,相關結(jié)果將在后續(xù)公布。
MTT S4000是基于摩爾線程的全功能GPU架構(gòu)設計的,是專為大模型打造的訓推一體通用計算卡。它支持多種計算精度,包括FP64、FP32、TF32、FP16、BF16和INT8,并配備了48GB的高性能顯存。憑借摩爾線程自研的MTLink1.0技術(shù),MTT S4000可以實現(xiàn)多卡互聯(lián)及千卡集群部署,為千億參數(shù)大模型的訓練、微調(diào)和推理提供強大的算力支持。MTT S4000還具備先進的圖形渲染、視頻編解碼和超高清8K HDR顯示能力,能夠滿足人工智能、科學計算、多媒體處理等復合場景的需求。
摩爾線程能夠迅速完成DeepSeek R1-671B大模型的適配驗證,主要得益于其完善的MUSA生態(tài)軟件棧和高效的開發(fā)實踐。這包括vLLM_MUSA推理框架、MUTLASS、Triton-MUSA等,這些技術(shù)優(yōu)勢不僅展示了MUSA軟件棧的高效適配能力,還使其整體性能達到了行業(yè)主流水平。這也進一步證明了摩爾線程在國產(chǎn)GPU技術(shù)創(chuàng)新和生態(tài)建設方面的強大實力。
最近,摩爾線程還推出了搭載MTT S4000的MCCX DeepSeek大模型一體機。這款產(chǎn)品深度融合了國產(chǎn)全功能GPU、深度優(yōu)化的高性能推理引擎和軟件棧,全面支持從蒸餾版到671B參數(shù)全量版的DeepSeek模型部署需求。它可以靈活適配廣泛的行業(yè)、場景和應用,通過摩爾線程的自主技術(shù)鏈,實現(xiàn)開箱即用、安全可控的一站式大模型服務。這不僅為政企客戶提供了高效易用的國產(chǎn)化AI基礎設施,還顯著降低了大模型的應用門檻。