【ITBEAR科技資訊】9月6日消息,阿里云近日發(fā)布了一款創(chuàng)新的視頻生成大模型,名為I2VGen-XL,并已在魔搭社區(qū)開放體驗。這一模型的推出引起了廣泛的關注,因為它可以在用戶上傳一張圖片后,僅需短短的2分鐘左右,就能夠生成一段高分辨率的1280*720視頻。不僅如此,該模型的研發(fā)團隊還表示,未來將進一步提升效果,實現2K超清畫質,以滿足更多領域的需求,包括短視頻內容制作和電影制作等。
據ITBEAR科技資訊了解,與目前熱門的AI繪畫創(chuàng)作大模型不同,視頻生成大模型面臨更高的技術挑戰(zhàn)。它需要克服文本與視頻內容的匹配度問題,確保生成視頻的畫面質量和連貫性。此前,阿里云以及微軟等科技巨頭相繼推出了一系列可控視頻生成的研究成果,允許用戶通過定義空間布局、運動模式等條件來生成視頻,但畫面清晰度難以滿足真實場景應用的需求。
目前,I2VGen-XL的模型和代碼已經開源,國內外社交媒體上出現了大量用戶和開發(fā)者的創(chuàng)意AI視頻生成內容。例如,一些用戶創(chuàng)造了城堡上展翅的恐龍和宇航員在飛船中行走的科幻電影畫面等。這一創(chuàng)新在視覺生成領域取得了顯著的進展,此前阿里云已推出了通義萬相(基座模型Composer)和可控視頻生成模型VideoComposer,團隊在該領域發(fā)表了60多篇CCF-A類論文,并在國際頂級視覺競賽中贏得了10余項冠軍。
這一新模型的發(fā)布為視頻內容創(chuàng)作領域帶來了全新的可能性,將進一步推動AI技術在影視制作和短視頻領域的應用發(fā)展。隨著模型的不斷優(yōu)化和開源,我們可以期待看到更多創(chuàng)意和多樣化的視頻內容涌現。