聲明:本文來(lái)自于微信公眾號(hào) 頭號(hào)AI玩家(ID:AIGCplayer),采訪| 月山橘 賴賴,授權(quán)轉(zhuǎn)載發(fā)布
48小時(shí)不到,OpenAI首個(gè)文生視頻模型Sora官宣推文在X上瀏覽量破八千萬(wàn)。
爆火的原因無(wú)它,該模型能根據(jù)文字提示詞生成長(zhǎng)達(dá)1分鐘的多視角高清視頻,僅這點(diǎn)就足以吊打市面上主流的如Runway、Pika、SVD等AI視頻生成工具。
圍繞Sora發(fā)布,全網(wǎng)各路玩家熱議不斷,有人贊美、有人唱衰,也有人已經(jīng)做好99元限時(shí)優(yōu)惠的Sora模型課程。
喧囂之下,我們今天邀請(qǐng)到9位業(yè)內(nèi)一線玩家,探討Sora對(duì)內(nèi)容行業(yè)、尤其是視頻領(lǐng)域帶來(lái)的影響,以及AIGC沖擊下,誰(shuí)會(huì)被淘汰,未來(lái)內(nèi)容從業(yè)者又需要具備什么樣的核心競(jìng)爭(zhēng)力。
@海辛 實(shí)驗(yàn)電影人、AIGC藝術(shù)家
“Sora可能是目前AI視頻模型里,寫實(shí)類表現(xiàn)最好的”
目前看demo,Sora寫實(shí)類的效果應(yīng)該表現(xiàn)特別好,可能會(huì)是目前AI視頻模型里寫實(shí)類表現(xiàn)最好的。
風(fēng)格化的demo展現(xiàn)有限(只有一個(gè)2D插畫類型的)可能和訓(xùn)練素材更多在寫實(shí)素材上有關(guān)。我認(rèn)為可能會(huì)出現(xiàn)和DallE2一樣比較尷尬的位置:至今你都沒(méi)辦法讓DallE2畫具體某個(gè)游戲畫風(fēng)的角色/場(chǎng)景,由于數(shù)據(jù)集本身的多樣性不夠,導(dǎo)致沒(méi)有辦法做具體的項(xiàng)目風(fēng)格,風(fēng)格沒(méi)有辦法自定義,對(duì)于大多數(shù)商業(yè)項(xiàng)目來(lái)說(shuō)就沒(méi)有意義,即實(shí)用性很低。
但看img2video(圖生視頻)的部分,做氛圍片、概念片,這種類型的片子應(yīng)該綽綽有余了,是能吃掉一部分市場(chǎng)的。
Sora還有兩個(gè)很厲害的地方:
1. 生成多個(gè)鏡頭,同時(shí)主角保持相對(duì)連貫,這個(gè)是在之前的AI視頻生成工具(只能生成單個(gè)鏡頭且細(xì)節(jié)總是無(wú)法保持統(tǒng)一)沒(méi)有做到的。
2. 提供了一種新的視頻編輯交互范式,即用自然語(yǔ)言來(lái)描述視頻的修改需求,然后生成新的視頻,這在其V2V editing(視頻生視頻)的部分體現(xiàn)得很突出。
十分贊同“人人都是導(dǎo)演”這種說(shuō)法,工具和資本本來(lái)都是創(chuàng)作的門檻,這個(gè)門檻越來(lái)越低了是好事。
@土豆人toudou_man AIGC藝術(shù)家
“Sora面世,未來(lái)創(chuàng)作者的價(jià)值體現(xiàn)在解決實(shí)際問(wèn)題”
60秒在生成式視頻領(lǐng)域里算是長(zhǎng)視頻了。Sora模型在多鏡頭、連續(xù)內(nèi)容、穩(wěn)定性、高畫質(zhì)、空間認(rèn)知等方面,給現(xiàn)有的技術(shù)工具如SVD、Pika和Runway帶來(lái)了不小沖擊。
Sora的面世意味著個(gè)人創(chuàng)作者的應(yīng)用空間被進(jìn)一步拓展,無(wú)需依賴傳統(tǒng)拍攝和制作手段就能創(chuàng)作出高質(zhì)量的內(nèi)容。未來(lái)這樣穩(wěn)定的生成式內(nèi)容也會(huì)逐步滲透到廣告和影視領(lǐng)域,至少在一定程度上替代部分現(xiàn)有的工作流程。
對(duì)于Sora的實(shí)際效果,我持謹(jǐn)慎態(tài)度。真正影響AI生成式視頻內(nèi)容在廣告和影視領(lǐng)域發(fā)展的,還是內(nèi)容一致性和內(nèi)容準(zhǔn)確性兩個(gè)重要的判斷標(biāo)準(zhǔn)。這兩個(gè)標(biāo)準(zhǔn)是決定技術(shù)能否被引入工業(yè)流程的關(guān)鍵因素。
可以預(yù)見(jiàn),Sora會(huì)和早期圖文生成一樣,進(jìn)一步降低視效內(nèi)容創(chuàng)作的門檻,卷死一些中層的內(nèi)容創(chuàng)作者和制作公司。但同時(shí),帶來(lái)的也是全新的機(jī)會(huì)點(diǎn),因?yàn)閯?chuàng)作門檻降低,視頻創(chuàng)作內(nèi)容的維度也會(huì)迎來(lái)新的井噴。
部分創(chuàng)作者和公司焦慮的主要源頭是“單位價(jià)值”,如果內(nèi)容被判定為廉價(jià)且易于制作的,那就意味著產(chǎn)出的內(nèi)容不值錢。AIGC的核心競(jìng)爭(zhēng)力是降本增效,創(chuàng)作者的價(jià)值則體現(xiàn)在是否能解決實(shí)際問(wèn)題、內(nèi)容產(chǎn)出的定位和創(chuàng)作者的IP影響力。
@八云 宙晴營(yíng)銷實(shí)驗(yàn)室創(chuàng)始人
“談不上打擊,企業(yè)和內(nèi)容生產(chǎn)者應(yīng)該看到Sora帶來(lái)的降本提效機(jī)會(huì)”
我一直比較堅(jiān)信未來(lái)商業(yè)組織的形式會(huì)發(fā)生改變。DAO(去中心化自治組織)實(shí)現(xiàn)了公平的分配機(jī)制,剩下的是如何最大化解放個(gè)體生產(chǎn)力。Sora的出現(xiàn)則提供了更廣闊的想象空間,比如一個(gè)由AGI和區(qū)塊鏈結(jié)合的、沒(méi)有總部的獨(dú)角獸公司。
回看抖音的發(fā)展路線,是工具到社區(qū)、再到國(guó)民級(jí)娛樂(lè)應(yīng)用。但是抖音犧牲了一部分工具屬性來(lái)?yè)Q取更多的社交屬性,所以后面有了剪映來(lái)支持比抖音直拍更復(fù)雜的內(nèi)容生產(chǎn)。
Sora通過(guò)指令去生成完整視頻這個(gè)形式,抖音和剪映沒(méi)法比較了,因?yàn)樵诮档烷T檻和成本上已經(jīng)不在一個(gè)級(jí)別。
所以Sora是否能從工具走向內(nèi)容消費(fèi),在于上線后看看這個(gè)工具對(duì)生產(chǎn)力解放到什么地步,通過(guò)指令生成的視頻需要“調(diào)教”的比例是多少、難度高低如何。
我目前對(duì)AIGC使用最多是基礎(chǔ)編輯、設(shè)計(jì)工作,提升工作效率。另外,我的一個(gè)小癖好是編寫世界設(shè)定,已經(jīng)寫滿了幾個(gè)備忘錄。之所以會(huì)成為一個(gè)獨(dú)特的興趣是因?yàn)闆](méi)有生產(chǎn)力和時(shí)間把這么多的設(shè)定變成長(zhǎng)內(nèi)容,無(wú)論是小說(shuō)還是影像,目前都需要投入大量時(shí)間甚至新的學(xué)習(xí)成本。所以我對(duì)Sora是充滿期待的。
以目前Sora的測(cè)試視頻看,我覺(jué)得對(duì)于影視工業(yè)來(lái)說(shuō)談不上打擊,更多的作用是降低成本。個(gè)體創(chuàng)作者應(yīng)該會(huì)加倍興奮,技術(shù)迭代讓創(chuàng)作者的核心能力集中在內(nèi)容本身,比如故事能力,光影分鏡只要你腦海里有,且能表達(dá)出來(lái),生產(chǎn)內(nèi)容的能力會(huì)指數(shù)級(jí)提高。
Sora對(duì)內(nèi)容行業(yè)的賦能是雙向的。其實(shí)短視頻平臺(tái)已經(jīng)實(shí)現(xiàn)了“人人都是導(dǎo)演”,生產(chǎn)工具從膠片到手機(jī),人人持有。個(gè)體KOL比拼的也已經(jīng)是性格魅力、表演里和故事力,當(dāng)本來(lái)就手握生產(chǎn)工具、制作和發(fā)行的賬號(hào)創(chuàng)作者迎來(lái)Sora這樣的工具的時(shí)候,未來(lái)可能會(huì)有影視公司購(gòu)買短視頻作品版權(quán)。因?yàn)槟憧梢砸粋€(gè)人生產(chǎn)有完整設(shè)定和世界觀的短片。
另一方面,Sora在國(guó)內(nèi)很可能會(huì)先解決營(yíng)銷號(hào)重復(fù)內(nèi)容、碎片內(nèi)容、純情緒內(nèi)容的生產(chǎn)成本。相比影視行業(yè),可能直接沖擊的工作崗位是營(yíng)銷號(hào)小編或者集中編短劇的“內(nèi)容村”。
企業(yè)營(yíng)銷負(fù)責(zé)人和內(nèi)容生產(chǎn)者應(yīng)看到Sora帶來(lái)的降本提效的機(jī)會(huì),尤其是在短視頻傳播和獲客方面。此外,如何把個(gè)人編寫的世界設(shè)定變成短片,也是等Sora模型上線后,我會(huì)去觀察的另一個(gè)方向。
@尹伯昊 猴子無(wú)限CEO
“內(nèi)容生產(chǎn)成本降低之后,需求也會(huì)更大規(guī)模地提升”
Sora在技術(shù)上最大的變化就是,引入了在文本模型中被充分驗(yàn)證有效的自回歸策略(以Tranformer為具體的技術(shù)實(shí)現(xiàn)方式),讓視頻生成的邏輯從關(guān)注像素變化變成關(guān)注語(yǔ)義變化,從空鏡頭生成變成故事的生成。
作為對(duì)比,在Sora之前的文本生成視頻的工作大多關(guān)心:如何讓單幀圖片強(qiáng)行動(dòng)起來(lái),導(dǎo)致生成出來(lái)的內(nèi)容很像空鏡頭。
這實(shí)際上是技術(shù)路徑上的系統(tǒng)性升級(jí),但是恰恰因?yàn)檫@是找到了一條很好的路徑,所以其他團(tuán)隊(duì)跟進(jìn)會(huì)更容易(而GPT-4才是真正大量具體技巧組成的,更難以被跟進(jìn))。我相信三個(gè)月內(nèi)市場(chǎng)上就會(huì)有達(dá)到現(xiàn)有Sora80%效果的跟進(jìn)模型出現(xiàn),甚至有局部場(chǎng)景的領(lǐng)先。
目前看X上發(fā)布的Sora視頻,可以看出其下限是非常高的,而且有很多內(nèi)容上限也很高,基本上達(dá)到了可以在大熒幕上直出的狀態(tài)。
猴子無(wú)限不是基座模型公司,所以理論上所有基座模型上的進(jìn)展對(duì)于我們來(lái)說(shuō),都是充分的利好,因?yàn)槲覀兛梢栽诨P偷哪芰A(chǔ)上做很多額外的工作,比如產(chǎn)品化地解決穩(wěn)定性和可擴(kuò)展性的問(wèn)題,并變成給客戶的解決方案。“客戶不需要鉆頭而需要是墻上鉆好的眼”,市場(chǎng)上新的“鉆頭”出現(xiàn)之后,能加速我們“鉆出的眼”的質(zhì)量和價(jià)值,這件事對(duì)于行業(yè)中絕大多數(shù)公司是一致的。
很多創(chuàng)作者擔(dān)心Sora(和已經(jīng)出現(xiàn)很久的其他大模型)帶來(lái)影視行業(yè)的失業(yè),是因?yàn)槲覀兛吹搅斯┙o效率的快速提升,而沒(méi)有去關(guān)心因?yàn)?strong>內(nèi)容生產(chǎn)成本降低之后,需求更大規(guī)模的提升,如果我們相信全新的需求會(huì)因此井噴,那么大概率焦慮會(huì)小很多。
未來(lái)內(nèi)容創(chuàng)作者最大的機(jī)會(huì)其實(shí)是,從商業(yè)的角度看世界,跳出傳統(tǒng)的“工具人”角色,去找到因?yàn)樾录夹g(shù)出現(xiàn)能夠滿足的新機(jī)會(huì),比如:將已有的內(nèi)容規(guī)模化地變成更有吸引力和LTV的形式(小說(shuō)變有聲書和視頻);根據(jù)長(zhǎng)尾理論,滿足過(guò)去因?yàn)槌杀具^(guò)高無(wú)法被滿足的需求;將單語(yǔ)言和單文化的內(nèi)容快速擴(kuò)展到更多文化和國(guó)家中(換臉和配音本地化),機(jī)會(huì)遠(yuǎn)超在現(xiàn)有需求中和AI內(nèi)卷。
至于Sora未來(lái)會(huì)不會(huì)取代TikTok,從一個(gè)內(nèi)容創(chuàng)作工具變成內(nèi)容分發(fā)、消費(fèi)平臺(tái),我認(rèn)為一個(gè)很好的例子是印刷術(shù),這涉及到內(nèi)容消費(fèi)的權(quán)力。在印刷術(shù)發(fā)明之前,人們需要聚集在教堂里聽(tīng)識(shí)字的人拿著羊皮卷圣經(jīng)傳道,這個(gè)過(guò)程中,掌握媒介的人實(shí)際上掌握了社會(huì)權(quán)力。
現(xiàn)在內(nèi)容創(chuàng)作的權(quán)力被新技術(shù)下放了,TikTok帶來(lái)的權(quán)力結(jié)構(gòu)(中心化的內(nèi)容生產(chǎn)者)一定會(huì)發(fā)生系統(tǒng)性的變化。未來(lái)大概率是有新的形態(tài)出現(xiàn),但是和TikTok是平行而不是替代的關(guān)系,就像雖然圣經(jīng)隨處可得,現(xiàn)在仍然有教堂一樣。
@Genji 人工智能頭部博主
“Sora實(shí)現(xiàn)了從0到1的突破,從1到100甚至10000只是時(shí)間問(wèn)題”
Sora被描述為一個(gè)“世界模型”,這個(gè)概念意味著它不遠(yuǎn)不止是一個(gè)簡(jiǎn)單的視頻生成器,而是一個(gè)能夠理解和模擬物理世界復(fù)雜運(yùn)行規(guī)律的模型。
從放出的Demo中,我們可以看到,Sora在視頻長(zhǎng)度、一致性、分辨率、對(duì)世界的理解等方面表現(xiàn)出了許多突破,但是對(duì)于文生視頻領(lǐng)域中一個(gè)非常重要的問(wèn)題——真實(shí)世界的事件運(yùn)行方式需要符合物理定律,Sora目前并沒(méi)有給出完美的解決方案。
關(guān)于Sora模型的技術(shù)細(xì)節(jié)和實(shí)現(xiàn)方式,以及它是否使用了虛幻引擎UE5(Unreal Engine5),都只是基于模型展示的效果和現(xiàn)有AI技術(shù)的推測(cè)。
Sora發(fā)布后,很多人宣稱電影特效、影視拍攝、短視頻等工作崗位將面臨失業(yè)危機(jī),我認(rèn)為這在短時(shí)間內(nèi)不會(huì)到來(lái)。目前,我已經(jīng)把AIGC工具融入了自己日常的工作流,雖然AI的強(qiáng)大能力不容置疑,但我的直觀感受是,現(xiàn)在的AI仍缺乏“靈性”。
一個(gè)好的文學(xué)藝術(shù)作品,不止需要有好的技術(shù)呈現(xiàn)形式,更要有好的故事創(chuàng)意和情感溫度。在一些短平快的內(nèi)容上,AI的速度優(yōu)勢(shì)已經(jīng)明顯體現(xiàn)出來(lái)了,我認(rèn)為這不是一件壞事,它可以把人類創(chuàng)作者從中解放出來(lái),從事更具創(chuàng)造性的活動(dòng)。
可以說(shuō),Sora的誕生讓我們離AGI更近了。一旦實(shí)現(xiàn)了從0到1的突破,那么1到100甚至10000就只是時(shí)間問(wèn)題。
@喬治 電影制作與游戲引擎從業(yè)者
“影視制作預(yù)可視化、特效低成本化開(kāi)啟新紀(jì)元”
Sora完全是一個(gè)跨時(shí)代的產(chǎn)物,它的底層邏輯完全不是目前已知的模式,跟Runway Gen-2、Pika,還有本地部署的SVD都不是一個(gè)級(jí)別的。
Runway和Pika我都使用過(guò),真正生成視頻素材的過(guò)程中,就是在抽卡,抽個(gè)十次才有可能得到一個(gè)能用的鏡頭,效果實(shí)際也一般,畫質(zhì)有待進(jìn)一步提升。但兩者都收費(fèi),不是很實(shí)用。
“人人都是導(dǎo)演”的趨勢(shì)是擋不住的,這是一個(gè)時(shí)代進(jìn)程問(wèn)題。未來(lái)會(huì)更考驗(yàn)創(chuàng)作者的功底,AI繪畫的門檻是低,但想把AI繪畫工具用好,可能還是有專業(yè)繪畫背景的那幫人更有優(yōu)勢(shì)。你要有審美和認(rèn)知,懂原理,才能更好地駕馭AI。現(xiàn)在做視頻也一樣,像我們做電影電視劇的,即便交給AI去生成視頻鏡頭和素材,也依然需要了解傳統(tǒng)制作的所有方法,普通人入圈是沒(méi)有什么用的。
對(duì)于高成本的特效場(chǎng)景,Sora可以提供一種成本更低的替代方案,尤其是在預(yù)算有限的項(xiàng)目中。比如電視劇和電影有些鏡頭,按照傳統(tǒng)的拍攝和制作流程,報(bào)價(jià)比較高,就可以直接用AI來(lái)做。
還有一種情況,導(dǎo)演很多天馬行空的創(chuàng)意,成本和經(jīng)費(fèi)都是hold不住的。但AI可以在影視制作前期用于預(yù)可視化,幫助導(dǎo)演和制片人更直觀地規(guī)劃場(chǎng)景和故事線,大大降低制作公司、影視公司、視效指導(dǎo)等多方的溝通成本和試驗(yàn)成本。
@李3水 W的野狗頭子
“人人都是導(dǎo)演”是五年前的說(shuō)法,目前應(yīng)該是“人人都是電視臺(tái)”
對(duì)于Sora可能會(huì)給個(gè)體內(nèi)容創(chuàng)作者或廣告公司帶來(lái)的沖擊,W的態(tài)度是“只嫌風(fēng)浪還不夠大”,希望各行業(yè)最期(焦)盼(慮)的影響加速到來(lái),且趨勢(shì)成真。
歷史性技術(shù)大爆發(fā)都是漸進(jìn)加速的,目前所有東西都是外部技術(shù)和應(yīng)用環(huán)境遠(yuǎn)超內(nèi)部、定義和定價(jià)權(quán)全然不在自己人手上,比起Sora最后實(shí)際落地是否能夠超預(yù)期,這種不理想體驗(yàn)更心塞。
“人人都是導(dǎo)演”是五年前的說(shuō)法,目前應(yīng)該是“人人都是電視臺(tái)”。
面對(duì)AI沖擊,W一直倡導(dǎo)的務(wù)虛能力和哲科思維,我認(rèn)為是未來(lái)內(nèi)容創(chuàng)作者應(yīng)該培養(yǎng)的核心競(jìng)爭(zhēng)力。
@雷濤 新壹科技CEO
“Sora仍是生成視頻素材級(jí)別的AI工具”
在視頻生成技術(shù)方面,目前新壹科技實(shí)現(xiàn)了4秒視頻生成,效果與Pika/Runway類似。而Sora支持最長(zhǎng)60秒視頻生成,目前釋放出的試用效果遠(yuǎn)遠(yuǎn)超出了市場(chǎng)上已有的其它產(chǎn)品。但整體而言,Sora仍然是生成視頻素材級(jí)別的AI工具,一個(gè)完整的視頻作品通常需要幾十個(gè)素材才能構(gòu)成。
新壹科技的一幀秒創(chuàng)可以通過(guò)已有素材、AI素材的組合完成作品級(jí)的視頻生成,Sora生成的素材同樣可以為秒創(chuàng)所用。素材生成技術(shù)的進(jìn)步對(duì)秒創(chuàng)是極大的利好,一方面可以降低對(duì)現(xiàn)成素材的依賴,另一方面也能夠提升生成效果。
不過(guò),視頻最終比拼的還是創(chuàng)意,有創(chuàng)意的人始終是少數(shù),GPT出來(lái)這么久了也沒(méi)見(jiàn)人人都成為作家。Sora可以幫助那些沒(méi)有視頻制作技能但有好創(chuàng)意的人,跟專業(yè)創(chuàng)作者站到同一條起跑線。
@方偉 游方科技CEO
“一個(gè)生產(chǎn)力爆炸的時(shí)代正在開(kāi)啟,內(nèi)容行業(yè)會(huì)卷到?jīng)]法想象”
相比之前的模型,Sora確實(shí)讓影視從業(yè)者更加焦慮了。目前來(lái)看,Sora生成視頻的效果和時(shí)長(zhǎng)都可以滿足商業(yè)。身邊做AI文生視頻的朋友,很巧也在面臨裁員,不做底層模型轉(zhuǎn)做應(yīng)用了。我們也在等Sora的API開(kāi)放,落地接一些短視頻之類的廣告業(yè)務(wù)。
至于短劇是否可行,還得等模型出來(lái)后自己測(cè)一波。
一個(gè)生產(chǎn)力爆炸的時(shí)代正在開(kāi)啟,以后大家都要拼創(chuàng)意,內(nèi)容行業(yè)會(huì)卷到?jīng)]法想象。
Sora完全有可能從一個(gè)視頻內(nèi)容創(chuàng)作工具變成視頻內(nèi)容分發(fā)、消費(fèi)平臺(tái),這要看Sam(OpenAI CEO)怎么想,但Sora替代不了TikTok,團(tuán)隊(duì)基因不一樣。
寫在最后
Sora的橫空出世,無(wú)疑給AI視頻生成領(lǐng)域帶來(lái)了新一輪洗牌。內(nèi)容從業(yè)者和AI創(chuàng)業(yè)公司都需要重新審視自己的核心競(jìng)爭(zhēng)力,在新一輪技術(shù)浪潮中找到自己的位置。
對(duì)于個(gè)人內(nèi)容創(chuàng)作者,Sora將視頻創(chuàng)作門檻無(wú)限拉低,內(nèi)容創(chuàng)作將不再受限于技術(shù)呈現(xiàn)形式,而進(jìn)入拼創(chuàng)意、拼內(nèi)容調(diào)性、拼人設(shè)、拼IP的時(shí)代。每個(gè)人都有可能成為機(jī)構(gòu)之外的超級(jí)個(gè)體,借助Sora等AI工具,將自己的創(chuàng)意轉(zhuǎn)化為引人入勝的視頻。
對(duì)于企業(yè)而言,Sora不僅僅是一個(gè)降本增效的工具,也開(kāi)啟了一種全新的商業(yè)模式和組織形態(tài)的探索。誰(shuí)能篤定未來(lái)不會(huì)出現(xiàn)一家由AGI和區(qū)塊鏈結(jié)合的、沒(méi)有總部的獨(dú)角獸公司呢?
目前,市場(chǎng)上對(duì)Sora的期待與溢美之詞已經(jīng)鋪天蓋地,然而,其真正的價(jià)值與影響還需要在實(shí)際應(yīng)用中驗(yàn)證。本文通過(guò)分享9位一線從業(yè)者的思考,希望能幫助大家更理性地評(píng)估Sora帶來(lái)的機(jī)遇與挑戰(zhàn)。