9月19日 快手自研文生圖大模型“可圖”(Kolors)已開啟內(nèi)測(cè)。可圖大模型能夠基于開放式文本生成風(fēng)格多樣、畫質(zhì)精美、創(chuàng)意十足的繪畫作品,讓用戶輕松高效地完成藝術(shù)創(chuàng)作。
據(jù)悉,快手“AI玩評(píng)”依托于快手自研文生圖大模型“可圖”(Kolors)強(qiáng)大的圖像生成能力實(shí)現(xiàn)。可圖大模型具備文本理解、豐富的細(xì)節(jié)刻畫、多樣的風(fēng)格轉(zhuǎn)換三大特點(diǎn)。
據(jù)了解,快手AI構(gòu)建了數(shù)十億的圖文訓(xùn)練,這些數(shù)據(jù)覆蓋了常見的三千萬中文實(shí)體概念,兼具世界知識(shí)。快手AI利用自研的中文LLM,融合CLIP的圖文特征作為文生圖的文本理解模塊,不但實(shí)現(xiàn)了中文特色概念的理解,更解決了復(fù)雜概念、屬性混淆等文生圖領(lǐng)域常見問題。同時(shí),快手AI更改了去噪算法的底層公式和加噪公式,實(shí)現(xiàn)了單一基座模型在主體完整的前提下,可生成具有豐富細(xì)節(jié)和紋理的圖片。
【來源:鳳凰網(wǎng)科技】