聲明:本文來自于微信公眾號(hào) TopKlout克勞銳(ID:TopKlout),作者:吳銳,授權(quán)轉(zhuǎn)載發(fā)布。
今年,數(shù)字人在直播電商行業(yè)徹底火了。
伴隨著數(shù)字人主播大規(guī)模應(yīng)用,國(guó)內(nèi)上演起了“百模大戰(zhàn)”,低至百元的數(shù)字人也成了一門火熱的生意。而數(shù)字人的另一面,是不確定的使用效果、平臺(tái)不斷加強(qiáng)的監(jiān)管、被割韭菜的追風(fēng)者、市場(chǎng)的質(zhì)疑聲等。
數(shù)字人為何能夠成為一種風(fēng)潮?數(shù)字人的發(fā)展前景究竟如何?未來數(shù)字人行業(yè)的發(fā)展將走向何方?
數(shù)字人熱潮與多樣化呈現(xiàn)
今年,數(shù)字人在短視頻平臺(tái)涌現(xiàn)。
短視頻中的虛擬形象往往會(huì)出現(xiàn)在一個(gè)精致的虛擬場(chǎng)景中,構(gòu)建一個(gè)炫酷的內(nèi)容宇宙,通過技術(shù)發(fā)掘了短視頻內(nèi)容新的呈現(xiàn)方式。最具代表性的就是會(huì)捉妖的美妝達(dá)人“柳夜熙”,她的一條視頻容納了懸疑、劇情、美妝及后期特效等多種熱門的內(nèi)容分類。各種圍繞柳夜熙的仿妝、cosplay等二次創(chuàng)作內(nèi)容在平臺(tái)爆發(fā),她也一度成為了當(dāng)時(shí)最具話題度的虛擬形象。
目前,抖音與快手是數(shù)字人應(yīng)用較多的平臺(tái),但兩個(gè)平臺(tái)對(duì)數(shù)字人的態(tài)度不同。
抖音對(duì)數(shù)字人有一定的管控,據(jù)抖音發(fā)布的《關(guān)于人工智能生成內(nèi)容的平臺(tái)規(guī)范暨行業(yè)倡議》,使用人工智能技術(shù)輔助創(chuàng)作是被允許的行為,不違反平臺(tái)規(guī)范,并不會(huì)限制虛擬人直播技術(shù)。而快手目前沒有任何關(guān)于數(shù)字人方面官方性的說明,因此不少數(shù)字人供應(yīng)商將主要聚焦在抖音直播賽道。
從內(nèi)容角度來講,數(shù)字人直播領(lǐng)域分為兩個(gè)方向,一個(gè)是娛樂直播,一個(gè)是電商直播,而電商直播根據(jù)是否發(fā)快遞又分為本地生活直播和常規(guī)帶貨直播。
娛樂直播背后的載體是人與人之間情感的鏈接,目前2D數(shù)字人主播很難實(shí)現(xiàn)這一需求,而3D虛擬數(shù)字人已有A-SOUL等案例出現(xiàn)。在電商直播領(lǐng)域,本地生活直播間更多的是電子核銷券,用戶在直播間下單后到店消費(fèi)。而帶貨直播則主要聚焦在品類較為單一的爆品直播間。
目前數(shù)字人主播驅(qū)動(dòng)模式主要分為“純智能驅(qū)動(dòng)模式”和“半真人驅(qū)動(dòng)模式”。“純智能驅(qū)動(dòng)模式”主要靠關(guān)鍵詞喚醒以及在線答疑實(shí)現(xiàn)用戶交互,針對(duì)直播中的常規(guī)高頻問題,關(guān)鍵詞喚醒不需要數(shù)字人主播回復(fù),便可解決用戶問題。而在線答疑則是在數(shù)字人產(chǎn)品講解結(jié)束后,對(duì)此進(jìn)行解答,雖然有一定的延時(shí),但對(duì)用戶體驗(yàn)并沒有太大影響。
而“半真人驅(qū)動(dòng)模式”則在真人輔助下結(jié)合虛擬人技術(shù)實(shí)現(xiàn)互動(dòng)。半真人驅(qū)動(dòng)直播間前端是虛擬形象,背后是中之人,可以做到實(shí)時(shí)在線交互,與真人直播間的觀看體驗(yàn)比較接近。此外,半真人驅(qū)動(dòng)直播間另一種形式是使用中控,由運(yùn)營(yíng)在背后操控直播間。
例如去年,胡兵在抖音以自身的虛擬人形象上演了一場(chǎng)虛擬走秀,在不斷變換的場(chǎng)景下不間斷地展現(xiàn)了服裝的賣點(diǎn)和特征,通過深度的帶入,呈現(xiàn)了一場(chǎng)沉浸式的帶貨直播。
圖源抖音截圖
值得一提的是,按照當(dāng)前技術(shù)的發(fā)展,數(shù)字人直播間通過調(diào)用大語(yǔ)言模型,在沒有真人輔助的情況下也能實(shí)現(xiàn)實(shí)時(shí)交互,但受制于平臺(tái)規(guī)則,這種類型的直播間并不被允許。
在短視頻領(lǐng)域,數(shù)字人應(yīng)用的場(chǎng)景相對(duì)廣泛。比如在TOG方面,一些國(guó)企、央企內(nèi)部有大量需要去視頻宣發(fā)的內(nèi)容,但實(shí)際上很多地方容易重復(fù)性勞動(dòng)。如果使用數(shù)字人,無需使用場(chǎng)地搭建團(tuán)隊(duì),也不用攝影、剪輯、編導(dǎo)等人員,在建模的時(shí)候可以批量的去輸出大量的內(nèi)容,提高工作效率。
數(shù)字人同樣適用有個(gè)人IP的博主,博主復(fù)制數(shù)字分身后,便可以快速追熱點(diǎn),不用受制于拍攝環(huán)境。
針對(duì)直播間與短視頻這兩個(gè)場(chǎng)景,2D數(shù)字人有著不同的收費(fèi)標(biāo)準(zhǔn)。銀翼未來創(chuàng)始人熊大表示“我們公司應(yīng)用在短視頻場(chǎng)景中的數(shù)字人使用費(fèi)為每年8000元,其中包括真人形象克隆與一年的使用權(quán)益”,不過銀翼科技視頻場(chǎng)景中的數(shù)字人以時(shí)長(zhǎng)收費(fèi),前半年期限內(nèi)有500分鐘的免費(fèi)時(shí)長(zhǎng),后半年則按照一分鐘20元收費(fèi)。
而在直播場(chǎng)景,數(shù)字人的使用成本有所上升。通常而言,數(shù)字人供應(yīng)商的主播形象分為公有庫(kù)和私有庫(kù)。如果使用公有庫(kù)的模板主播是6萬元一年,不過公有庫(kù)的主播會(huì)出現(xiàn)被多個(gè)客戶使用的情況,而平臺(tái)一但檢測(cè)到同一個(gè)faceID出現(xiàn)在不同的城市或直播間,那么數(shù)字人直播間可能會(huì)面臨被封控或者限流的情況。
圖源抖音截圖
為了規(guī)避主播“撞臉”給直播間帶來的風(fēng)險(xiǎn),不少客戶會(huì)花費(fèi)8000元進(jìn)行形象克隆,這歸屬于客戶的私有庫(kù),其他客戶不能被調(diào)用,一年的使用費(fèi)用基本上為68000元。
降本是機(jī)構(gòu)入局的核心原因
降本是數(shù)字人最顯著的價(jià)值之一。對(duì)于數(shù)字人的應(yīng)用第一節(jié)省了人員的成本,第二節(jié)省了一部分的培訓(xùn)的成本。
舉例來看,在杭州一個(gè)主播每個(gè)小時(shí)的費(fèi)用是300元至500元,再加上運(yùn)營(yíng)以及場(chǎng)控,單個(gè)直播間的一個(gè)月費(fèi)用至少5萬元。如果算上采購(gòu)燈光、相機(jī)等設(shè)備,以及租場(chǎng)地和布景的費(fèi)用,還有其他的一些物料,直播間的成本還會(huì)更高。
而數(shù)字人直播間大大降低了成本。數(shù)字人供應(yīng)商通過輸出一路信號(hào),這路信號(hào)里面包括場(chǎng)景、主播、話術(shù)等,直播間通過窗口捕捉的形式,用OBS推流到抖音、快手、或者淘寶等平臺(tái)后就立馬可以開播,每個(gè)月的價(jià)格僅為2000塊錢左右。
在直播能力上,數(shù)字人可以實(shí)現(xiàn)超過真人的平均水平。但前提是優(yōu)質(zhì)算力作為技術(shù)支撐,能做到聲畫同步,并且能夠與用戶互動(dòng)。此外,運(yùn)營(yíng)的作用也十分關(guān)鍵,話術(shù)也是影響數(shù)字人直播效果的因素。優(yōu)質(zhì)算力加上成熟運(yùn)營(yíng)才能構(gòu)成高質(zhì)量直播間。
魯班七號(hào)副總裁劉洋在采訪中表示:“與真人主播相比,數(shù)字人直播間的成本僅為它的1/25,本質(zhì)上來講,只要數(shù)字人直播間的效果能夠達(dá)到真人主播的1/25,就不算差。”并且實(shí)測(cè)下來,數(shù)字人的效果能達(dá)到是真人主播的1/3或1/2,甚至比真人主播還要好,這就是當(dāng)下的一個(gè)機(jī)遇,它以較低的成本解決了商家不能開播以及播不好的情況。
值得一提的是,魯班七號(hào)也布局了自己的本地生活直播間,每天的銷售額能達(dá)到幾萬元,雖然核銷率只有百分之二三十,再乘以15%左右的傭金,一個(gè)直播間每天也能賺千元,一個(gè)月的收入就是3萬。實(shí)際上它投入成本也就只有一臺(tái)電腦和軟件的使用費(fèi),綜合來看數(shù)字人有著較高的性價(jià)比。
目前數(shù)字人集中在品牌廣告客戶這一角色類型上。對(duì)于數(shù)字人直播帶貨的這個(gè)需求,品牌廣告客戶的購(gòu)買力更強(qiáng),接受度也更高,溝通成本也會(huì)更低一點(diǎn)。對(duì)于部分品牌來說,直播帶貨已經(jīng)成為了日常銷售渠道,無需進(jìn)入頭部主播直播間,普通帶貨主播就能滿足品牌需求,而數(shù)字人主播可以起到平替的作用。
數(shù)字人的價(jià)值還體現(xiàn)在主播職業(yè)增強(qiáng)方面。對(duì)于頭部主播而言,數(shù)字分身可以填補(bǔ)主播休息時(shí)段,進(jìn)一步提高時(shí)間利用率。
在數(shù)字人技術(shù)的加持下,直播間的場(chǎng)景能有更大的想象空間。通常情況下,真人直播間受制于物理?xiàng)l件因素,主播能夠展示的空間比較局限,場(chǎng)景比較單一。而數(shù)字人直播間可以做到近景遠(yuǎn)景隨意切換,場(chǎng)景也更加多元化,給用戶沉浸式的觀看體驗(yàn)。
在短視頻的場(chǎng)景,數(shù)字人能夠大大節(jié)省時(shí)間成本,它的工具價(jià)值已經(jīng)被驗(yàn)證。劉潤(rùn)的視頻號(hào)和分眾傳媒江南春已經(jīng)使用數(shù)字人技術(shù)。相較于真人錄音,數(shù)字人單個(gè)短視頻創(chuàng)作時(shí)間大約可以減少一個(gè)小時(shí)。而在還原度方面,通過聲音克隆訓(xùn)練之后,只需要輸入文本就可以復(fù)刻真人的音色。值得一提的是,目前數(shù)字分身視頻制作時(shí)需要真人錄一小段音頻,以達(dá)到更好的音畫同步效果。
虛擬與真實(shí)的天平仍未平衡
雖然數(shù)字人的價(jià)值正在被驗(yàn)證,但數(shù)字人對(duì)行業(yè)各個(gè)參與方的影響不容忽視。
從主播的角度來看,在直播帶貨行業(yè),主播處于一個(gè)相對(duì)優(yōu)勢(shì)的位置,不管直播間的銷售額如何,主播薪資也有一定的保障。而如果數(shù)字人復(fù)制了主播的形象,對(duì)于公司而言,成本能夠降低,但主播則可能面臨收入縮減或者失業(yè)的風(fēng)險(xiǎn),因此成熟的主播并不會(huì)積極參與建模。
具體來看,對(duì)于頭部主播而言,數(shù)字分身主播雖然能夠持續(xù)占據(jù)用戶視線,充分發(fā)揮主播的個(gè)人影響力,但在去頭部主播趨勢(shì)下,頭部主播一般會(huì)通過培養(yǎng)助播的方式加強(qiáng)直播間影響力,規(guī)避單一主播帶來的風(fēng)險(xiǎn)。對(duì)于腰尾部主播而言,有行業(yè)人士提到,“小主播剛?cè)胄胁痪茫枷Mㄟ^自身的努力獲得更大的發(fā)展,更加愛惜自己的羽毛,基本上也不會(huì)使用數(shù)字分身”。
不過目前在直播帶貨領(lǐng)域,已有直播間通過明星肖象授權(quán)的方式進(jìn)行帶貨。有網(wǎng)友發(fā)現(xiàn)在辰亦儒、朱梓驍?shù)让餍鞘跈?quán)的直播間,明星本人不出鏡,明星的數(shù)字形象進(jìn)行效果展示,這也引起不少網(wǎng)友的不滿。有網(wǎng)友表示“明星賺錢本就相對(duì)容易,這樣更相當(dāng)于躺著數(shù)錢,實(shí)在是難以接受。”可見,數(shù)字分身的應(yīng)用價(jià)值在理論上可行,但只有經(jīng)歷市場(chǎng)的考驗(yàn)才能真正發(fā)揮實(shí)際意義。
從平臺(tái)的角度來看,數(shù)字人主播一旦大規(guī)模應(yīng)用,會(huì)大大降低平臺(tái)的內(nèi)容質(zhì)量。數(shù)字人直播間風(fēng)格千篇一律,甚至很多主播的形象都相同,平臺(tái)的內(nèi)容質(zhì)量難以保障。如果平臺(tái)的內(nèi)容不具有吸引力,就會(huì)造成用戶流失,不管是平臺(tái)的廣告還是電商業(yè)務(wù)都會(huì)受到影響,營(yíng)收更難以保證。因此短視頻平臺(tái)會(huì)對(duì)數(shù)字人直播間進(jìn)行一定的限制,主要針對(duì)劣質(zhì)的直播內(nèi)容,當(dāng)數(shù)字人的直播水平在自然人的平均線之下,就容易觸碰平臺(tái)底線。
從技術(shù)的角度來看,數(shù)字人的制作在行業(yè)并非難點(diǎn),國(guó)內(nèi)外不少大廠都有數(shù)字人模型的開源代碼,而數(shù)字人供應(yīng)商只需要API接口就能使用。為了加強(qiáng)自身的競(jìng)爭(zhēng)力,行業(yè)已經(jīng)開始卷向4K清晰度,以實(shí)現(xiàn)更逼真的效果。
不過,數(shù)字人目前難以與用戶之間建立較強(qiáng)的情感鏈接,這主要在于數(shù)字人主播與用戶之間的互動(dòng)是單向的,數(shù)字人雖然能夠回復(fù)用戶的問題,但這種回復(fù)是機(jī)械的,數(shù)字人不能站在用戶的角度去思考和發(fā)問,因此難以產(chǎn)生持續(xù)性的互動(dòng)。
從行業(yè)的角度來看,有行業(yè)人士表示,有一些數(shù)字人的廠家其實(shí)沒有認(rèn)真在做產(chǎn)品,可能有割韭菜的嫌疑。他們利用一些人的知識(shí)盲區(qū),把數(shù)字人生意包裝成財(cái)富密碼,然后用發(fā)展代理的形式,收“追風(fēng)者”五十萬甚至百萬的代理費(fèi),把數(shù)字人產(chǎn)品賣給一些從來沒有從事過短視頻生產(chǎn)和直播的這些人,本質(zhì)上就是一個(gè)“擊鼓傳花”的游戲。
很多代理商交錢之后,找不到客戶,或者客戶沒有直播經(jīng)驗(yàn),應(yīng)用起來比較困難,并要求代理商退款。而代理商發(fā)現(xiàn)數(shù)字人生意并非那么容易,并認(rèn)為自己被數(shù)字人廠家欺騙,走上維權(quán)的道路,這也讓行業(yè)蒙塵。
實(shí)際上,數(shù)字人看起來成本低,不用太多資源,但還是需要較高的門檻。數(shù)字人直播間同樣需要“人、貨、場(chǎng)”匹配,并且有著各式各樣的玩法。對(duì)于沒有行業(yè)經(jīng)驗(yàn)的人來說,通過直播間起號(hào)是比較困難的事情,如果沒有流量,直播間的存在就沒有意義。
并且目前市場(chǎng)上沒有爆款數(shù)字人直播間出現(xiàn),很多數(shù)字人直播間的在線人數(shù)可能一直都是在十個(gè)人左右,這并不利于行業(yè)的長(zhǎng)久發(fā)展。因?yàn)閿?shù)字人廠商在拓展市場(chǎng)時(shí),需要有優(yōu)質(zhì)案例作為支撐,而客戶看不到預(yù)期效果,就會(huì)對(duì)數(shù)字人持懷疑態(tài)度。甚至有客戶表示,不期望能賺多少,能不能收回投入的成本是最先考慮的問題。數(shù)字人在推廣落地時(shí)的困難很大程度上影響了行業(yè)的發(fā)展。
有行業(yè)人士透露“不少數(shù)字人供應(yīng)商認(rèn)為市場(chǎng)已經(jīng)成熟,還擴(kuò)大團(tuán)隊(duì)規(guī)模準(zhǔn)備大干一場(chǎng),但現(xiàn)實(shí)情況卻重重受阻,不得不進(jìn)行戰(zhàn)略收縮,某頭部數(shù)字人供應(yīng)商的團(tuán)隊(duì)人數(shù)已經(jīng)從六百多人縮減到三百多人。”
在數(shù)字人供應(yīng)商與客戶之間,需要更多服務(wù)商出現(xiàn),不管是提供代運(yùn)營(yíng)還是培訓(xùn)業(yè)務(wù),服務(wù)商能夠解決應(yīng)用時(shí)的困難,也是推動(dòng)行業(yè)向前發(fā)展的關(guān)鍵一環(huán)。
規(guī)則與政策還需多方制定
數(shù)字人的應(yīng)用是越來越明顯的趨勢(shì)。體現(xiàn)在行業(yè)側(cè),越來越多的相關(guān)方參與其中,數(shù)字人更加多元化。就比如硅基智能與謙尋成立了一個(gè)合資公司。硅基智能作為技術(shù)提供方,謙尋作為直播電商運(yùn)營(yíng)服務(wù)方,在一定程度上解決了數(shù)字人技術(shù)與實(shí)際運(yùn)營(yíng)情況之間割裂的問題。
而硅基智能還與樂華成立了一個(gè)合資公司,進(jìn)行明星虛擬形象授權(quán)業(yè)務(wù),并投入到直播帶貨領(lǐng)域。目前,樂華旗下的一些藝人已經(jīng)試水。在抖音也能看到一些明星虛擬形象授權(quán)的直播間。
而在3D數(shù)字人領(lǐng)域,阿里達(dá)摩院和京東技術(shù)已經(jīng)成熟,更多聚焦在本地生活和文旅類目。而在2D真人領(lǐng)域,硅基智能屬于頭部,食品類目和生活類目應(yīng)用較多。
數(shù)字人目前面臨最大的挑戰(zhàn)就是平臺(tái)的規(guī)則。比如像抖音、淘寶、視頻號(hào)這些平臺(tái),相對(duì)來說規(guī)則束縛比較多,這其實(shí)會(huì)限制探索數(shù)字人的價(jià)值。比如虛擬人直播間要去官方報(bào)白名單,不然大概率會(huì)被限流,甚至被封禁,這個(gè)也是市場(chǎng)里許多參差不齊的數(shù)字人供應(yīng)商會(huì)遇到的問題。
數(shù)字人雖然是“主播”的角色,但與主播性質(zhì)完全不同,數(shù)字人的本質(zhì)是SaaS軟件,考量的標(biāo)準(zhǔn)是數(shù)字人供應(yīng)商穩(wěn)定服務(wù)的能力,對(duì)銷售額不用負(fù)責(zé)。而主播的考核與銷量、銷售額、場(chǎng)觀等指標(biāo)密切相關(guān)。
并且數(shù)字人解決不了直播全鏈路的問題。因?yàn)橹辈ラg“人、貨、場(chǎng)”是一個(gè)很復(fù)雜的場(chǎng)景,數(shù)字人今年只是解決了人的這個(gè)部分,貨盤以及直播間的運(yùn)營(yíng)策略,每一個(gè)團(tuán)隊(duì)需要各顯神通,各自解決自己的問題。
總的來看,數(shù)字人看似十分火熱,但應(yīng)用場(chǎng)景相對(duì)固定,需求市場(chǎng)仍未成熟,行業(yè)還處于初步發(fā)展期。并且數(shù)字人主播脫離現(xiàn)實(shí)生活,沒有背景支撐以及鮮明的性格特色,難以與用戶之間建立信任關(guān)系,直播間很難脫穎而出并擴(kuò)大影響力。未來,數(shù)字人能否在交互方面有創(chuàng)新性的突破?最終會(huì)以什么角色融入短視頻和直播帶貨行業(yè)?這些都值得期待。