在數字化浪潮洶涌的今天,多模態技術正引領全球科技創新的新篇章,而國產視頻大模型正逐漸成為這一變革的重要推手。近期,中關村論壇這一國際科技創新交流的頂級舞臺上,國產視頻大模型技術大放異彩。
3月29日,中關村論壇傳來喜訊,生數科技不僅憑借Vidu視頻大模型榮登論壇十大重大科技成果榜單,其首席技術官鮑凡更是在首屆AI100青年先鋒評選中獨占鰲頭。在科幻星球大賽中,Vidu視頻大模型還榮獲了科幻創作技術冠軍。這一系列榮譽不僅是對生數科技技術實力的肯定,更是國產視頻大模型在全球科技創新舞臺上嶄露頭角的標志。
中關村論壇上,清華大學人工智能研究院副院長、生數科技創始人兼首席科學家朱軍教授發布的高可控視頻大模型Vidu Q1更是成為全場焦點。這一科技成果的發布,標志著國產視頻大模型在技術創新上邁出了重要一步,為AI視頻生成領域指明了“高可控”時代的發展方向。
回顧一年前的中關村論壇未來人工智能先鋒論壇,生數科技與清華大學攜手發布了中國首個全面對標國際先進水平的視頻大模型Vidu,這一創舉在當時便引起了業界的廣泛關注。一年后,生數科技帶著技術更加成熟的Vidu Q1回歸,不僅實現了自我超越,更展示了國產大模型在全球舞臺上的競爭力。
朱軍教授在論壇上作了題為《中國多模態生成的全球引領》的主旨演講,深入闡述了國產視頻大模型在全球科技競爭中的關鍵作用和取得的技術突破。他分享了生數科技基于實踐探索和未來預測的Vidu發展藍圖,展望了多模態技術在虛實結合、物理世界交互等方面的廣闊前景。Vidu Q1的發布,不僅展現了中國在視頻大模型領域的深厚積累,更彰顯了國產大模型的全球引領實力。
作為業內首個高可控AI視頻大模型,Vidu Q1在多主體細節可控、音效同步可控、畫質增強等方面均取得了顯著成果。例如,在多主體細節可控方面,Vidu Q1能夠基于語義指令和參考圖視覺指令,對場景中多主體的位置、大小、運動軌跡等屬性進行精準控制,大大降低了AI視頻生成的隨機性,提升了生成質量。
音效同步可控功能則讓Vidu Q1能夠根據視頻環境和畫面轉場,生成相應的音效,并精準控制音效的長短和出現時間,大大增強了視頻的沉浸感和感染力。同時,通過畫質增強技術,Vidu Q1能夠為用戶提供更加清晰、細膩、逼真的視覺體驗。
Vidu Q1的發布,不僅為視頻內容創作領域帶來了革命性的變革,也為眾多行業的AI重構提供了全新的思路和解決方案。例如,在動漫領域,Vidu Q1能夠通過對角色、物體、場景等的精確控制,幫助創作者快速生成高質量動畫。這一優勢已經吸引了好萊塢知名動漫工作室Aura Productions的注意,雙方已達成合作,計劃共同制作50集動畫短劇。
Vidu Q1的成功發布,標志著AI視頻生成領域進入了一個新的發展階段。通過技術手段引入多元素控制,Vidu Q1實現了AI視頻生成的人為可控,這對于追求極致的制作團隊來說,無疑是一個新的里程碑。隨著技術的不斷進步和應用場景的拓展,國產視頻大模型將在全球科技創新舞臺上發揮越來越重要的作用。