在AI技術日新月異的當下,中國電信人工智能研究院(TeleAI)近日在“TeleAI開發者大會”上發布了一項引人注目的創新——基于星辰大模型的視頻生成大模型。這一舉措標志著國內運營商企業正式涉足AI視頻生成領域,與快手等互聯網巨頭同臺競技。
據悉,該視頻生成大模型是國內首個由央企全自研的AI視頻生成解決方案。通過整合語義、語音、文生圖等多模態能力,它能夠覆蓋短劇及影視制作的全流程,包括文字腳本撰寫、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等環節,旨在實現高效的成本控制和質量提升。
在大會上,TeleAI團隊展示了該模型的強大功能,通過支持主體目標時空一致性、個體復雜動作精準控制、音視頻同步生成等技術,不僅能夠駕馭多個主角和場景,還能確保生成的視頻內容流暢自然。這一演示贏得了與會者的廣泛贊譽。
據中國電信負責人透露,這款視頻生成大模型主要應用于高質量可控短劇的生成,旨在賦能文宣產業的創新發展。同時,該負責人還表示,TeleAI已完成國內首個全國產化萬卡萬參大模型的研發,隨著本次視頻生成大模型和視覺大模型的發布,星辰大模型系列已進一步完成了其全模態能力的構建。
回顧今年2月,美國OpenAI公司發布的視頻生成模型Sora在全球范圍內引起了轟動。僅需寥寥數語,Sora便能生成效果炸裂、鏡頭感堪比電影的長視頻。這一創舉激發了全球AI公司對視頻生成技術的熱情,眾多企業和教授紛紛參與其中,試圖打造“中國版Sora”。
然而,盡管Sora的demo驚艷了全球近300天,但至今仍未公開使用。相比之下,國內的AI視頻生成賽道卻呈現出加速發展的態勢。快手可靈、騰訊混元、字節即夢等互聯網大廠,以及生數、愛詩、HiDream等初創公司都紛紛加入其中,與全球的“類Sora”們展開競爭。
生成式AI視頻生成技術的興起,得益于計算機視覺、機器學習、ViT架構等多種AI技術手段的不斷發展。無論是文生視頻、圖生視頻還是視頻生視頻,AI驅動的視頻生成工具正在不斷增強視頻制作的工作流程,為影視、游戲、培訓與教育、營銷與廣告、社交媒體等領域的發展提供了更多的增長空間。
據市場研究機構預測,2024年全球AI視頻生成市場規模預計達到6.148億美元,到2032年,這一數字將增至25.629億美元(約合人民幣186.36億元),年復合增長率高達19.5%。隨著AI+視頻技術和產品的不斷升級迭代,電影、廣告、視頻剪輯、視頻流媒體平臺、UGC創作平臺、短視頻綜合平臺等眾多行業都將從中受益。
TeleAI自今年7月正式掛牌運營以來,已取得了顯著的成果。其自主研發的星辰大模型不僅通過了“境內深度合成服務算法備案”和產品備案,還在權威視頻生成評測榜單VBench中排名第一。在VBench的16個評分項目中,TeleAI視頻生成大模型一舉奪得9項第一,覆蓋了畫面穩定性、語義一致性、空間場景以及視覺風格等多個核心能力。
在大會期間,TeleAI還宣布與華為、中興、亞信科技、中科曙光等19家合作伙伴共同發布了中國電信人工智能開發者產業聯盟計劃。該計劃旨在聚合各方力量,加快推動AI產業發展,提升技術能力與應用水平,并為全球開發者賦能。
中國電信董事長柯瑞文表示,科技成果只有通過規模應用,才能促進技術不斷迭代完善,形成成熟的商業模式。他強調,生成式AI以前所未有的速度進行迭代和創新,大模型能力得到快速提升。未來,中國電信將繼續推動數智化應用深度融入行業生產場景,為客戶提供“算力+平臺+數據+模型+應用”的一體化服務。