引言
繼去年中的擴散生成模型(文字生成圖片)大熱后,今年的ChatGPT又火了,大家都想辦法繞過限制,注冊賬號,親自體驗。文字聊天玩膩了,就轉到文字生成圖片,圖片玩膩了,于是,升級成文字生成視頻,不亦樂乎。
《犬與少年》截圖
2023年1月31日?.NETflix宣布與小冰公司日本分部(rinna)、WIT STUDIO共同創作首部AIGC動畫短片《犬與少年》,講述小孩與機器狗重逢的故事。
AIGC目前已成為全球熱點,但多數仍停留在技術演示階段,普遍尚未實現作品級落地?!度c少年》就成了AIGC技術輔助商業化動畫片的首支發行級別作品,為動畫制作揭開新的未來。
那么,AIGC(AI自動生成內容)怎么就這么火呢?
AIGC風口已到
OpenAI的輪番路演(diffusion+chatgpt)下,AIGC成了當紅炸子雞,覆蓋文本,語音,圖像等等…
各個投資方躍躍欲試,生怕錯過此次風口。紅杉單獨發布了AIGC報告,描述藍圖顯示,AIGC包含了文本、語音、圖像、視頻、3D等方方面面。
AIGC產業藍圖
比爾蓋茨一聲令下,微軟開始 all in chatgpt了
當整個科技界對Web3和元宇宙的討論到最高點的時候,比爾蓋茨在美國社交新聞網站Reddit問答帖下的親自回復,引起了軒然大波。
“AI is the big one, Gates said in response to a user who asked if there is a mammoth shift in technology hAppening today. “I don't think Web3 was that big or that metaverse stuff alone was revolutionary but AI is quite revolutionary.”
“Web3沒那么重要,元宇宙沒革命性,人工智能最重要。”
ChatGPT火了
近幾年,GPT模型經過了多次蛻變,一代比一代強(詳見文末的技術博客)。2022年11月,在GPT 3.5+RLHF(基于人工反饋的強化學習)結合下,ChatGPT正式誕生。2023年,GPT 4即將誕生。迭代速度之快,讓人應接不暇。
GPT系列演變史
短短兩個月時間,ChatGPT已經衍生出一系列創業生態,比如賣賬號(淘寶一堆店鋪),小程序(掙廣告費),寫手,短視頻…全網都在討論ChatGPT。
說不定ChatGPT真的變成AI屆的html,必備的基礎工具
ChatGPT持續進化
爆火后的chatGPT并沒有原地踏步,而是不斷變異。用戶發現chatGPT的“高情商”行為,迎合“老婆”故意說2+5=8,chatGPT連夜迭代,增加了基于事實計算能力,在基本事實面前,“老婆”不再管用了。chatGPT已經可以根據用戶反饋自動修正答案了,雖然尚不支持中文運算優先級,且有些拼接痕跡,似乎學到了標注人員腦子里的規則。
改進前的效果:“老婆”說啥就是啥,2+5=?
改進前
改進后,兼顧高情商和高智商,變成了“那我祝您老婆每天都有好心情!不過,就數學公式而言,2+2仍然等于4”
改進后
不用再用對話系統里死板的意圖識別槽位抽取狀態機之類的軟規則了…可見,chatGPT已經具備一定理解能力了
文生圖(擴散模型)
2022年中,擴散模型發布后,各大廠商(OpenAI的DALL-E、Stable Diffusion、百度文心等)推出的文字生成圖片產品,效果也讓人眼前一亮,紛紛跑過去體驗text2image…
用戶只需輸入一行文本,描述需求,機器就能直接生成一張令人滿意的圖片。
(1) Fine, beautiful country fields, super wide angle, overlooking, morning by Makoto Shinkai.
(2) A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.
(3) Fairy tale steam country by greg rutkowski and thomas kinkade Trending on artstation.
(4) A beautiful render of a magical building in a dreamy landscape by daniel merriam, soft lighting, 4k hd wallpaper, Trending on artstation and behance.
文升圖效果
AIGC為什么火
回到主題:AIGC為什么火?
技術上,傳統判別模型解決模式識別問題(條件概率),理解能力有限,而生成模型(聯合概率)賦予了AI靈魂,開始從工具進化到“人”,總算有點AGI的樣子了,不用再準備數據,根據下游任務finetune了…
《騰訊研究院AIGC發展趨勢報告》中提到:內容創作模式的四個發展階段
(1)PGC:專家制作,2000年左右的web 1.0門戶網站時代,專業新聞機構發文章
(2)UGC:用戶創作,2010年左右web 2.0時代(微博、人人之類),以及移動互聯網時代(公眾號),用戶主導創作,專家審核
(3)AIUGC:用戶主要創作,機器(算法)輔助審核,如在抖音、頭條、公眾號上發視頻、文章,先通過算法預判,再人工復核,在成本與質量中均衡
(4)AIGC:AI主導創作,以2022年底先后出現的擴散模型、chatGPT為代表,創作過程中,幾乎不需要人工介入,只需一句話描述需求即可。
內容創作模式
AI自動生成內容的方式實現了AI從感知到生成的躍遷。
目前AIGC處于技術成熟度曲線(gartner)爬坡期,gartner將AIGC列為2022年最有影響力的5大技術之一,2022年也被稱為AIGC元年。
2022年gartner曲線
算法上,過去幾年生成算法(VAE/GAN)、預訓練模型(Transformer/GPT)、多模態技術(CLIP/DALL-E/擴散模型)的不斷積累、融合,催生了AIGC的爆發
AIGC產業生態逐步成型
(1)基礎層:大廠地盤,涉及云計算(亞馬遜/微軟/谷歌)、GPU(英偉達)、預訓練(OpenAI/谷歌等)
(2)中間層:垂直場景,模型及服務(Model as a service)類公司(如stable diffusion)
(3)應用層:C端消費群體,聊天機器人,小程序,網頁接口等
應用
本輪技術奇點過后,AIGC應用能否大爆發呢?拭目以待。
附錄:
騰訊AIGC發展趨勢報告:https://mp.weixin.qq.com/s/9AjTpyL4HmQ6BDhWIDbD0A
紅杉報告:https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/