近日,一項關于圖像生成技術的創(chuàng)新專利由北京百度網(wǎng)訊科技有限公司正式公布,引起了業(yè)界的廣泛關注。據(jù)天眼查財產(chǎn)線索信息透露,該專利名為“圖像生成模型的構建方法、圖像生成方法及其裝置”,深入探索了圖像處理與人工智能領域的融合。
此專利詳細闡述了一種全新的圖像生成方案。具體而言,它首先收集樣本圖像及其對應的樣本提示詞,作為訓練的基礎數(shù)據(jù)。接著,利用一個被稱為第一預處理網(wǎng)絡的技術手段,對樣本圖像進行處理,提取出控制條件和目標潛在空間編碼。與此同時,另一個第二預處理網(wǎng)絡則將樣本提示詞轉換為文本向量,為后續(xù)的圖像生成提供語義指導。
在核心環(huán)節(jié),該專利將目標潛在空間編碼、文本向量和控制條件共同作為輸入,送入一個待訓練的UNet網(wǎng)絡中。通過結合UNet網(wǎng)絡輸出的噪聲分布,對UNet網(wǎng)絡進行精細訓練,最終得到一個訓練有素的目標UNet網(wǎng)絡。這一步驟是圖像生成過程中的關鍵,它確保了生成的圖像既符合語義要求,又具備高度的真實感和細節(jié)豐富性。
進一步地,該專利還提出了一種基于第一預處理網(wǎng)絡、第二預處理網(wǎng)絡、目標UNet網(wǎng)絡和解碼器構建的圖像生成模型。這一模型不僅簡化了圖像生成的流程,還顯著提高了圖像生成的效率和質(zhì)量。通過這一模型,用戶可以輕松地將文本提示轉化為生動的圖像,為圖像創(chuàng)作和設計帶來了全新的可能性。
據(jù)天眼查信息顯示,北京百度網(wǎng)訊科技有限公司在人工智能領域一直保持著領先地位,此次公布的圖像生成技術專利更是其在圖像處理領域的一次重要突破。該專利的公布不僅展示了百度在技術創(chuàng)新方面的實力,也為整個行業(yè)樹立了新的標桿。
隨著人工智能技術的不斷發(fā)展,圖像生成技術將在更多領域得到應用和推廣。北京百度網(wǎng)訊科技有限公司的這一專利無疑為圖像生成技術的發(fā)展注入了新的活力,也為相關行業(yè)帶來了更多的想象空間和發(fā)展機遇。