騰訊在近期推出了一項(xiàng)創(chuàng)新技術(shù),正式揭曉了其騰訊混元文生視頻大模型。這一消息由“騰訊云”微信公眾號(hào)率先披露,標(biāo)志著騰訊在AI視頻生成領(lǐng)域的又一重大突破。
這款視頻大模型支持中英文輸入,并適配多種視頻尺寸和清晰度,為內(nèi)容創(chuàng)作者提供了前所未有的靈活性。為了展示其能力,騰訊團(tuán)隊(duì)利用該模型制作了一段以“兩只小貓?jiān)诖螋[”為主題的小視頻,風(fēng)格寫(xiě)實(shí)且生動(dòng)。
目前,這項(xiàng)功能已在騰訊元寶App上開(kāi)放試用,企業(yè)用戶則可以通過(guò)騰訊云接入,API內(nèi)測(cè)申請(qǐng)也已同步啟動(dòng)。這一舉措無(wú)疑將加速AI視頻生成技術(shù)的普及和應(yīng)用。
騰訊還宣布將此視頻生成大模型開(kāi)源,據(jù)稱這是目前最大的視頻開(kāi)源模型,參數(shù)量高達(dá)130億。騰訊云發(fā)布的評(píng)測(cè)結(jié)果顯示,該模型在文本視頻一致性、運(yùn)動(dòng)質(zhì)量和畫(huà)面質(zhì)量等多個(gè)維度均表現(xiàn)優(yōu)異,尤其在人物和人造場(chǎng)所等復(fù)雜場(chǎng)景下。