引言
繼去年中的擴(kuò)散生成模型(文字生成圖片)大熱后,今年的ChatGPT又火了,大家都想辦法繞過限制,注冊賬號,親自體驗(yàn)。文字聊天玩膩了,就轉(zhuǎn)到文字生成圖片,圖片玩膩了,于是,升級成文字生成視頻,不亦樂乎。
《犬與少年》截圖
2023年1月31日?.NETflix宣布與小冰公司日本分部(rinna)、WIT STUDIO共同創(chuàng)作首部AIGC動畫短片《犬與少年》,講述小孩與機(jī)器狗重逢的故事。
AIGC目前已成為全球熱點(diǎn),但多數(shù)仍停留在技術(shù)演示階段,普遍尚未實(shí)現(xiàn)作品級落地。《犬與少年》就成了AIGC技術(shù)輔助商業(yè)化動畫片的首支發(fā)行級別作品,為動畫制作揭開新的未來。
那么,AIGC(AI自動生成內(nèi)容)怎么就這么火呢?
AIGC風(fēng)口已到
OpenAI的輪番路演(diffusion+chatgpt)下,AIGC成了當(dāng)紅炸子雞,覆蓋文本,語音,圖像等等…
各個(gè)投資方躍躍欲試,生怕錯過此次風(fēng)口。紅杉單獨(dú)發(fā)布了AIGC報(bào)告,描述藍(lán)圖顯示,AIGC包含了文本、語音、圖像、視頻、3D等方方面面。
AIGC產(chǎn)業(yè)藍(lán)圖
比爾蓋茨一聲令下,微軟開始 all in chatgpt了
當(dāng)整個(gè)科技界對Web3和元宇宙的討論到最高點(diǎn)的時(shí)候,比爾蓋茨在美國社交新聞網(wǎng)站Reddit問答帖下的親自回復(fù),引起了軒然大波。
“AI is the big one, Gates said in response to a user who asked if there is a mammoth shift in technology hAppening today. “I don't think Web3 was that big or that metaverse stuff alone was revolutionary but AI is quite revolutionary.”
“Web3沒那么重要,元宇宙沒革命性,人工智能最重要。”
ChatGPT火了
近幾年,GPT模型經(jīng)過了多次蛻變,一代比一代強(qiáng)(詳見文末的技術(shù)博客)。2022年11月,在GPT 3.5+RLHF(基于人工反饋的強(qiáng)化學(xué)習(xí))結(jié)合下,ChatGPT正式誕生。2023年,GPT 4即將誕生。迭代速度之快,讓人應(yīng)接不暇。
GPT系列演變史
短短兩個(gè)月時(shí)間,ChatGPT已經(jīng)衍生出一系列創(chuàng)業(yè)生態(tài),比如賣賬號(淘寶一堆店鋪),小程序(掙廣告費(fèi)),寫手,短視頻…全網(wǎng)都在討論ChatGPT。
說不定ChatGPT真的變成AI屆的html,必備的基礎(chǔ)工具
ChatGPT持續(xù)進(jìn)化
爆火后的chatGPT并沒有原地踏步,而是不斷變異。用戶發(fā)現(xiàn)chatGPT的“高情商”行為,迎合“老婆”故意說2+5=8,chatGPT連夜迭代,增加了基于事實(shí)計(jì)算能力,在基本事實(shí)面前,“老婆”不再管用了。chatGPT已經(jīng)可以根據(jù)用戶反饋?zhàn)詣有拚鸢噶耍m然尚不支持中文運(yùn)算優(yōu)先級,且有些拼接痕跡,似乎學(xué)到了標(biāo)注人員腦子里的規(guī)則。
改進(jìn)前的效果:“老婆”說啥就是啥,2+5=?
改進(jìn)前
改進(jìn)后,兼顧高情商和高智商,變成了“那我祝您老婆每天都有好心情!不過,就數(shù)學(xué)公式而言,2+2仍然等于4”
改進(jìn)后
不用再用對話系統(tǒng)里死板的意圖識別槽位抽取狀態(tài)機(jī)之類的軟規(guī)則了…可見,chatGPT已經(jīng)具備一定理解能力了
文生圖(擴(kuò)散模型)
2022年中,擴(kuò)散模型發(fā)布后,各大廠商(OpenAI的DALL-E、Stable Diffusion、百度文心等)推出的文字生成圖片產(chǎn)品,效果也讓人眼前一亮,紛紛跑過去體驗(yàn)text2image…
用戶只需輸入一行文本,描述需求,機(jī)器就能直接生成一張令人滿意的圖片。
(1) Fine, beautiful country fields, super wide angle, overlooking, morning by Makoto Shinkai.
(2) A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.
(3) Fairy tale steam country by greg rutkowski and thomas kinkade Trending on artstation.
(4) A beautiful render of a magical building in a dreamy landscape by daniel merriam, soft lighting, 4k hd wallpaper, Trending on artstation and behance.
文升圖效果
AIGC為什么火
回到主題:AIGC為什么火?
技術(shù)上,傳統(tǒng)判別模型解決模式識別問題(條件概率),理解能力有限,而生成模型(聯(lián)合概率)賦予了AI靈魂,開始從工具進(jìn)化到“人”,總算有點(diǎn)AGI的樣子了,不用再準(zhǔn)備數(shù)據(jù),根據(jù)下游任務(wù)finetune了…
《騰訊研究院AIGC發(fā)展趨勢報(bào)告》中提到:內(nèi)容創(chuàng)作模式的四個(gè)發(fā)展階段
(1)PGC:專家制作,2000年左右的web 1.0門戶網(wǎng)站時(shí)代,專業(yè)新聞機(jī)構(gòu)發(fā)文章
(2)UGC:用戶創(chuàng)作,2010年左右web 2.0時(shí)代(微博、人人之類),以及移動互聯(lián)網(wǎng)時(shí)代(公眾號),用戶主導(dǎo)創(chuàng)作,專家審核
(3)AIUGC:用戶主要創(chuàng)作,機(jī)器(算法)輔助審核,如在抖音、頭條、公眾號上發(fā)視頻、文章,先通過算法預(yù)判,再人工復(fù)核,在成本與質(zhì)量中均衡
(4)AIGC:AI主導(dǎo)創(chuàng)作,以2022年底先后出現(xiàn)的擴(kuò)散模型、chatGPT為代表,創(chuàng)作過程中,幾乎不需要人工介入,只需一句話描述需求即可。
內(nèi)容創(chuàng)作模式
AI自動生成內(nèi)容的方式實(shí)現(xiàn)了AI從感知到生成的躍遷。
目前AIGC處于技術(shù)成熟度曲線(gartner)爬坡期,gartner將AIGC列為2022年最有影響力的5大技術(shù)之一,2022年也被稱為AIGC元年。
2022年gartner曲線
算法上,過去幾年生成算法(VAE/GAN)、預(yù)訓(xùn)練模型(Transformer/GPT)、多模態(tài)技術(shù)(CLIP/DALL-E/擴(kuò)散模型)的不斷積累、融合,催生了AIGC的爆發(fā)
AIGC產(chǎn)業(yè)生態(tài)逐步成型
(1)基礎(chǔ)層:大廠地盤,涉及云計(jì)算(亞馬遜/微軟/谷歌)、GPU(英偉達(dá))、預(yù)訓(xùn)練(OpenAI/谷歌等)
(2)中間層:垂直場景,模型及服務(wù)(Model as a service)類公司(如stable diffusion)
(3)應(yīng)用層:C端消費(fèi)群體,聊天機(jī)器人,小程序,網(wǎng)頁接口等
應(yīng)用
本輪技術(shù)奇點(diǎn)過后,AIGC應(yīng)用能否大爆發(fā)呢?拭目以待。
附錄:
騰訊AIGC發(fā)展趨勢報(bào)告:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A
紅杉報(bào)告:https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/