阿里巴巴在AI技術領域再次邁出重要一步,正式向公眾開源了其最新的通義萬相Wan2.1-VACE模型。這款模型不僅支持視頻生成,還涵蓋了視頻編輯的多項功能,展現了強大的技術實力。
通義萬相Wan2.1-VACE模型是阿里巴巴在AI繪畫創作大模型系列中的又一力作。它集文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時長延展等多種基礎生成和編輯能力于一身,為用戶提供了全方位的視頻創作和編輯解決方案。
據了解,此次開源的版本包括1.3B和14B兩個不同規模的模型,其中1.3B版本尤其值得關注,因為它能夠在消費級顯卡上流暢運行,大大降低了使用門檻,使得更多用戶能夠體驗到這款先進的AI模型。
通義萬相系列模型自2023年7月7日正式上線以來,便以其出色的圖片創作能力贏得了廣泛關注。而在2024年9月的阿里云棲大會上,阿里巴巴更是發布了通義萬相視頻生成大模型,該模型不僅能夠生成影視級高清視頻,還對中國語言有著更深入的理解,進一步提升了其實用性和用戶體驗。
在今年年初,通義萬相視頻生成模型已經升級至2.1版,整體性能得到了大幅提升。特別是在處理復雜運動、還原真實物理規律、提升電影質感以及優化指令遵循方面,該模型取得了顯著的進展,為用戶帶來了更加真實、細膩的視頻創作體驗。
而此次全面開源萬相2.1模型,更是阿里巴巴在AI技術開放共享方面邁出的重要一步。通過開源,阿里巴巴希望能夠吸引更多的開發者和技術愛好者加入到AI技術的研究和應用中來,共同推動AI技術的創新和發展。