劃重點(diǎn):
? 清華大學(xué)與阿里合作推出概念半透膜模型,能夠精準(zhǔn)、可控地擦除各類具象或抽象概念。
? 該模型已被 CVPR2024會議高分錄用,具有在 Diffusion 架構(gòu)的 AI 作圖模型中擦除特定概念的能力。
? 模型通過一維 Adapter 和微調(diào)策略實(shí)現(xiàn)概念擦除,同時(shí)保留其他生成內(nèi)容,并可動(dòng)態(tài)適配擦除信號。
(ChinaZ.com)3月13日 消息:清華大學(xué)與阿里安全聯(lián)合發(fā)布了概念半透膜模型(SPM),這一模型能夠在 Diffusion 架構(gòu)的 AI 作圖模型中,精準(zhǔn)、可控地擦除各類具象或抽象概念。
該模型的推出解決了傳統(tǒng) AI 作圖模型存在的生成涉黃、侵權(quán)等危險(xiǎn)概念的問題,實(shí)現(xiàn)了對特定概念的精確擦除。
概念半透膜模型通過一維 Adapter 和微調(diào)策略實(shí)現(xiàn)概念擦除,同時(shí)保留其他生成內(nèi)容。Adapter 作為一種「半透薄膜」插入到預(yù)訓(xùn)練的 Diffusion Model(DM)中,學(xué)習(xí)特定概念的可遷移識別及擦除,同時(shí)保持模型完整性。通過微調(diào)策略 Latent Anchoring,模型獲得對特定概念的擦除半滲透性,有效地擦除目標(biāo)概念并保留其他概念。模型在推理過程中通過 Facilitated Transport 機(jī)制動(dòng)態(tài)適配擦除信號,控制擦除效果,保證生成內(nèi)容的準(zhǔn)確性和完整性。
概念半透膜模型的實(shí)驗(yàn)效果表明,在單概念或多概念擦除時(shí),模型能夠穩(wěn)定且徹底地擦除目標(biāo)概念,同時(shí)對其他概念幾乎沒有影響。與其他方法相比,該模型具有更高的精確性和可控性,為 AI 作圖模型的應(yīng)用帶來新的可能性。
這一研究成果有望在 AI 內(nèi)生安全領(lǐng)域、可控生成等方面發(fā)揮重要作用,推動(dòng) AI 技術(shù)產(chǎn)品向著可用、可靠、可信、可控的方向發(fā)展。
SPM特色功能亮點(diǎn)總結(jié)如下:
概念消除功能 :使用一維適配器 Semi-Permeable Membrane(SPM),能夠精確刪除目標(biāo)概念而保留非目標(biāo)概念,實(shí)現(xiàn)通用、可定制和模型可轉(zhuǎn)移的擦除解決方案。
代際交替侵蝕解決 **:通過引入 Latent Anchoring 策略,在微調(diào)過程中有效減輕了參數(shù)漂移,避免了概念的交替和侵蝕現(xiàn)象。
遷移能力 :SPM 能夠在不重新調(diào)優(yōu)的情況下,從一個(gè)專門的模型遷移到另一個(gè),展現(xiàn)了其良好的擦除和保留能力。
藝術(shù)風(fēng)格消除 :SPM 可以擦除特定的藝術(shù)風(fēng)格而保留其他風(fēng)格,避免了以往在擦除和保留之間的明顯折衷。
明確內(nèi)容消除 :在處理涉及裸露內(nèi)容的情況下,SPM 能夠有效消除明確內(nèi)容,并展現(xiàn)了在不同情境下的擦除能力。
項(xiàng)目入口:https://top.aibase.com/tool/spm
論文網(wǎng)址:https://arxiv.org/abs/2312.16145