稀宇科技近期在視頻生成技術(shù)領(lǐng)域取得了突破性進(jìn)展,隆重推出了其最新的視頻生成模型——Hailuo02。這款模型在處理諸如體操動(dòng)作等高難度場(chǎng)景時(shí),展現(xiàn)出了卓越的性能,成為全球首個(gè)能夠?qū)崿F(xiàn)此類復(fù)雜效果的視頻生成模型。
自去年8月底稀宇科技發(fā)布視頻生成模型Demo網(wǎng)頁(yè)以來(lái),其海螺視頻產(chǎn)品便受到了廣大創(chuàng)作者的熱烈歡迎。據(jù)統(tǒng)計(jì),該產(chǎn)品已助力創(chuàng)作者生成了超過(guò)3.7億個(gè)視頻。此次Hailuo02的推出,不僅進(jìn)一步降低了視頻創(chuàng)作的門檻,還顯著提升了創(chuàng)作的質(zhì)量。
Hailuo02的核心競(jìng)爭(zhēng)力在于其獨(dú)特的Noise-aware Compute Redistribution(NCR)架構(gòu)。這一架構(gòu)在保持參數(shù)量級(jí)不變的情況下,將訓(xùn)練和推理效率提升了2.5倍。這意味著,在不增加創(chuàng)作者使用成本的前提下,可以采用更大的參數(shù)規(guī)模,從而使模型的表現(xiàn)力更加出色。同時(shí),得益于推理優(yōu)化的空間,Hailuo02的總參數(shù)量相較于上一代模型擴(kuò)大了三倍。
憑借更大的參數(shù)量和更高的訓(xùn)練效率,Hailuo02能夠處理更多的數(shù)據(jù)。結(jié)合創(chuàng)作者對(duì)Hailuo01的反饋,稀宇科技對(duì)數(shù)據(jù)量進(jìn)行了大幅擴(kuò)充,達(dá)到了上一代模型的四倍,同時(shí)數(shù)據(jù)的質(zhì)量和多樣性也得到了顯著提升。這使得新模型在復(fù)雜指令遵循和復(fù)雜物理表現(xiàn)方面取得了顯著進(jìn)步,能夠準(zhǔn)確響應(yīng)復(fù)雜指令,讓創(chuàng)作者的精心構(gòu)思得到更好的呈現(xiàn)。創(chuàng)作者還能以更加實(shí)惠的價(jià)格生成原生的1080p視頻。
在Artificial Analysis Video Arena的測(cè)試中,Hailuo02的一個(gè)早期版本便取得了全球第二的優(yōu)異成績(jī)。目前,該模型已在海螺視頻的Web端、APP端以及開(kāi)放平臺(tái)API中全面更新,提供了包括768p-6秒、768p-10秒和1080p-6秒在內(nèi)的三個(gè)版本。稀宇科技一直致力于為創(chuàng)作者提供業(yè)內(nèi)最優(yōu)的價(jià)格,并將繼續(xù)在提升生成速度、優(yōu)化偏好對(duì)齊、實(shí)現(xiàn)高階功能以及探索技術(shù)與藝術(shù)結(jié)合的極限等方面進(jìn)行快速迭代和更新。