谷歌在近日宣布了其視頻生成模型Veo的最新版本——Veo 2,正式向OpenAI的Sora發起挑戰,標志著AI視頻生成領域的競爭進一步加劇。據谷歌介紹,Veo 2在生成視頻內容的逼真度上有了顯著提升。
與此同時,谷歌還推出了圖像生成模型Imagen的升級版Imagen 3,旨在為用戶提供更加細膩且內容豐富的圖片生成體驗。
谷歌強調,Veo 2在理解現實世界的物理規律以及捕捉人類動作和表情的微妙之處上取得了顯著進步。目前,該模型已在谷歌實驗室的VideoFX平臺上開放試用,但僅限于通過谷歌表格注冊并加入等候名單的用戶,且需等待谷歌在特定時間段的臨時開放。
谷歌在官方博客中提到,Veo 2不僅擅長生成視頻內容,還能根據用戶指定的類型、鏡頭以及電影特效建議,制作出最高可達4K分辨率的視頻,充分展現了其在電影制作手法上的精通。
值得注意的是,Veo 2生成的視頻將嵌入谷歌特有的元數據水印SynthID,以此作為AI生成內容的標識。盡管Veo 2目前仍處于測試階段,但谷歌表示,與原始版本的Veo相比,新版本將大幅減少如多余手指等“幻覺”現象的出現。
在谷歌的內部測試中,Veo在“總體偏好”和“提示依從性”兩項關鍵指標上均超越了Sora及其他競爭對手的AI模型,為爭奪電影制作人及內容創作者的市場奠定了堅實基礎。此前,谷歌曾在I/O開發者大會上首次公布Veo,并與演員兼音樂人唐納德·格洛沃合作,共同制作了一段展示視頻。
AI視頻生成技術作為生成式AI領域的重要分支,一直備受關注。除了谷歌和OpenAI等大模型開發者外,RunwayML等較小規模的公司也在這一領域展開了激烈競爭。RunwayML最近推出了Gen-3 Alpha Turbo模型,提供了更強大的控制能力;Pika Labs則發布了Pika 2.0,賦予用戶更多控制權,并支持在視頻中加入自定義角色。Luma AI與亞馬遜AWS合作,將其模型引入Bedrock平臺,以滿足企業級需求。
然而,AI視頻生成技術仍面臨創作者和觀眾的質疑。例如,Sora在發布后就被用戶指出存在內容違背物理規律和人體結構的問題,結果表現不一致。在最近的游戲獎頒獎典禮上,觀眾對所謂“AI劣質內容”的不信任感也有所體現,這進一步加劇了人們對AI生成內容質量的擔憂。
盡管如此,仍有部分電影制作人開始探索AI視頻生成器的潛力。著名導演詹姆斯·卡梅隆加入了Stability AI的董事會,演員安迪·瑟金斯也宣布成立一家專注于AI的制作公司。谷歌表示,許多用戶對其AI視頻生成工具展現出濃厚興趣,YouTube創作者已開始利用VideoFX平臺為短片制作背景,以提升制作效率。
谷歌還對其圖像生成模型Imagen進行了全面升級,推出了Imagen 3。該模型已在Gemini聊天機器人中提供服務,生成的圖像更加逼真且色彩鮮艷。Imagen 3能夠更準確地渲染多種藝術風格,包括寫實主義、印象派、抽象藝術及動畫風格,同時在遵循用戶提示方面的表現也得到了顯著提升。用戶可通過ImageFX平臺訪問并使用Imagen 3。