(ChinaZ.com)6月9日 消息:企查查APP顯示,6月9日,北京百度網(wǎng)訊科技有限公司申請(qǐng)的“生成數(shù)字人的方法、模型的訓(xùn)練方法、裝置、設(shè)備和介質(zhì)”專利獲授權(quán)。
專利摘要顯示,本公開提供了一種生成數(shù)字人的方法、模型的訓(xùn)練方法、裝置、設(shè)備和介質(zhì),涉及人工智能領(lǐng)域,具體涉及自然語言處理、深度學(xué)習(xí)、計(jì)算機(jī)視覺、圖像處理、增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)等技術(shù)領(lǐng)域,可應(yīng)用于元宇宙等場(chǎng)景。實(shí)現(xiàn)方案為:獲取素材內(nèi)容;基于預(yù)訓(xùn)練的場(chǎng)景劃分模型,從素材內(nèi)容中確定多個(gè)場(chǎng)景,其中,多個(gè)場(chǎng)景中的每個(gè)場(chǎng)景分別對(duì)應(yīng)于素材內(nèi)容中的一個(gè)具有完整語義信息的內(nèi)容片段;以及對(duì)于多個(gè)場(chǎng)景中的每個(gè)場(chǎng)景,基于對(duì)應(yīng)的內(nèi)容片段,確定該場(chǎng)景對(duì)應(yīng)的目標(biāo)內(nèi)容;基于對(duì)應(yīng)的目標(biāo)內(nèi)容,確定該場(chǎng)景的場(chǎng)景標(biāo)簽信息;以及基于場(chǎng)景標(biāo)簽信息,配置特定于該場(chǎng)景的數(shù)字人。