近期,華為技術(shù)有限公司在人工智能領(lǐng)域的創(chuàng)新再添新章。據(jù)天眼查信息顯示,該公司于7月18日公布了一項名為“一種模型訓(xùn)練方法、數(shù)據(jù)生成方法及相關(guān)設(shè)備”的專利。
該專利聚焦于如何通過創(chuàng)新的手段降低擴散模型訓(xùn)練數(shù)據(jù)的獲取成本。具體而言,該方法巧妙地運用了帶有標簽的第一訓(xùn)練數(shù)據(jù)和不帶標簽的第二訓(xùn)練數(shù)據(jù),以及它們對應(yīng)的噪聲數(shù)據(jù)。
在第一階段,系統(tǒng)獲取多個第一訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)均帶有明確的標簽,并通過對它們進行特定次數(shù)的加噪處理,生成對應(yīng)的第一噪聲數(shù)據(jù)。緊接著,系統(tǒng)又獲取多個第二訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)不帶有標簽,但它們的噪聲水平相較于第一訓(xùn)練數(shù)據(jù)要低。同樣地,第二訓(xùn)練數(shù)據(jù)也經(jīng)過加噪處理,生成了對應(yīng)的第二噪聲數(shù)據(jù)。
值得注意的是,這兩種訓(xùn)練數(shù)據(jù)及其噪聲數(shù)據(jù)的獲取成本都相對較低,這為后續(xù)的模型訓(xùn)練奠定了堅實的基礎(chǔ)。基于這些噪聲數(shù)據(jù),系統(tǒng)對擴散模型的第一去噪模塊進行了訓(xùn)練,并最終得到了優(yōu)化后的第二去噪模塊。
據(jù)天眼查進一步的信息揭示,這種創(chuàng)新的訓(xùn)練方法不僅簡化了數(shù)據(jù)獲取流程,還顯著提高了模型訓(xùn)練的效率。通過利用不同噪聲水平的訓(xùn)練數(shù)據(jù),華為成功地降低了對高質(zhì)量、高成本標注數(shù)據(jù)的依賴,從而推動了人工智能技術(shù)的進一步發(fā)展。
該方法還為其他領(lǐng)域的數(shù)據(jù)處理和模型訓(xùn)練提供了新的思路。它證明了在人工智能領(lǐng)域,通過巧妙的數(shù)據(jù)處理和算法設(shè)計,可以在不犧牲性能的前提下,有效降低數(shù)據(jù)獲取和處理的成本。
華為此次公布的專利,無疑再次彰顯了其在人工智能領(lǐng)域的深厚實力和持續(xù)創(chuàng)新能力。隨著人工智能技術(shù)的不斷發(fā)展,我們有理由相信,華為將繼續(xù)引領(lǐng)行業(yè)潮流,推動人工智能技術(shù)向更高水平邁進。