華為開發(fā)者大會HDC 2025上,華為云計算迎來重大突破,華為常務董事及云計算CEO張平安隆重推出了盤古大模型5.5版本。此次升級覆蓋了自然語言理解NLP、計算機視覺CV、預測、多模態(tài)以及科學計算五大核心領(lǐng)域,為行業(yè)注入了全新的活力與價值。
張平安在大會上強調(diào),盤古大模型5.5是基于昇騰云的強大全棧軟硬件環(huán)境訓練而成,這一里程碑式的成就標志著昇騰架構(gòu)在全球大模型領(lǐng)域的卓越實力。他的話語中充滿了自豪與期待。
在NLP領(lǐng)域,盤古大模型5.5引入了全新的718B深度思考模型,這是一個由256位專家構(gòu)成的MoE(混合專家)大模型。它在知識推理、工具調(diào)用及數(shù)學等多個維度實現(xiàn)了顯著增強,展現(xiàn)了業(yè)界領(lǐng)先的能力。通過一系列創(chuàng)新算法,如通算掩蓋、全局動態(tài)均衡以及分組混合專家MoGE,盤古大模型在昇騰平臺上實現(xiàn)了高效訓練和推理,MFU訓練和單卡推理吞吐均達到了業(yè)界頂尖水平。
盤古大模型5.5在用戶體驗方面進行了全面升級,特別是在高效長序列處理、低幻覺現(xiàn)象控制、快慢思考融合以及Agent技術(shù)等方面。其中,自適應快慢思考合一技術(shù)尤為引人注目。該技術(shù)通過構(gòu)建難度感知的數(shù)據(jù)集和兩階段漸進式訓練,使模型能夠根據(jù)問題的難易程度靈活切換思考模式,從而在簡單問題上迅速響應,在復雜問題上則進行深入思考。這一創(chuàng)新使得整體模型的推理效率提升了8倍。
盤古深度研究工具DeepDiver同樣表現(xiàn)出色。通過長鏈難題合成和漸進式獎勵等關(guān)鍵技術(shù),DeepDiver在網(wǎng)頁搜索、常識性問答等應用場景中展現(xiàn)出了極高的執(zhí)行效率。例如,它能夠在5分鐘內(nèi)完成超過10條的復雜問答,并生成萬字以上的專業(yè)調(diào)研報告,極大地提升了工作效率。
在大會上,張平安還分享了盤古大模型在計算機視覺CV、預測、多模態(tài)以及科學計算等基礎(chǔ)模型方面的技術(shù)升級。這些升級不僅提升了模型的性能和準確性,還為農(nóng)業(yè)、工業(yè)、科研等多個領(lǐng)域帶來了豐富的創(chuàng)新應用和落地實踐。盤古大模型正逐步成為行業(yè)AI領(lǐng)域的先鋒力量,為解決行業(yè)難題提供了強有力的支持。