【ITBEAR科技資訊】2月20日消息,近日,字節(jié)跳動(dòng)推出了一款名為Boximator的顛覆性視頻模型,引發(fā)了科技界的廣泛關(guān)注。在Sora引爆文生視頻賽道之前,Boximator的亮相無(wú)疑為國(guó)內(nèi)視頻生成技術(shù)帶來了新的突破。
與傳統(tǒng)的視頻生成模型如Gen-2、Pink1.0等不同,Boximator具備一項(xiàng)獨(dú)特的功能:可以通過文本精準(zhǔn)控制生成視頻中人物或物體的動(dòng)作。這一特性使得Boximator在視頻生成領(lǐng)域展現(xiàn)出更高的靈活性和可控性,為用戶提供了更廣闊的創(chuàng)作空間。
然而,對(duì)于Boximator的實(shí)際應(yīng)用,字節(jié)跳動(dòng)相關(guān)人士表示,目前該項(xiàng)目仍處于技術(shù)方法研究階段,尚未達(dá)到完善的產(chǎn)品落地階段。與此同時(shí),與國(guó)外領(lǐng)先的視頻生成模型相比,Boximator在畫面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還存在一定的差距。
OpenAI前不久發(fā)布了首個(gè)視頻生成模型Sora。據(jù)悉,Sora僅需輸入提示詞,便能生成1分鐘的高清視頻。這一技術(shù)的出現(xiàn)被看作是視頻生成領(lǐng)域的一大革新。Sora模型能夠生成包含多個(gè)角色以及特定類型運(yùn)動(dòng)的復(fù)雜場(chǎng)景,且能精確呈現(xiàn)物體和背景的細(xì)節(jié)。在其官網(wǎng)上更新的48個(gè)視頻實(shí)例中,Sora不僅準(zhǔn)確呈現(xiàn)了視頻細(xì)節(jié),還展現(xiàn)出了對(duì)物體在現(xiàn)實(shí)世界中存在狀態(tài)的深刻理解,生成了具有豐富情感的角色。
盡管Boximator與Sora在視頻生成技術(shù)上有所差距,但字節(jié)跳動(dòng)的這次嘗試無(wú)疑為國(guó)內(nèi)視頻生成技術(shù)的發(fā)展提供了新的思路和方向。隨著技術(shù)的不斷進(jìn)步和創(chuàng)新,我們有理由相信,未來國(guó)內(nèi)將涌現(xiàn)出更多具有顛覆性的視頻生成技術(shù),為視頻創(chuàng)作領(lǐng)域注入新的活力。