(圖片由AI繪畫工具Midjourney生成)
2022,是世紀疫情與百年變局交織的一年,也是科技照亮世界的一年。
這一年,韋伯望遠鏡帶來的震撼,將重寫人類對于宇宙的認識。而在人類的藝術科學領域,AI正在進軍一場搶地戰(zhàn)。2022年12月,Science 雜志發(fā)布2022年度科學十大突破,AIGC 赫然在列。
這一年,生成式AI迎來爆發(fā)式增長,AIGC正在改變內容領域的生產(chǎn)方式,帶來了整個行業(yè)的變革。而早已探索多年生成式AI的出門問問,也在2022這一 AIGC 元年歷經(jīng)著完全不同的發(fā)展時期。
2022年,出門問問在持續(xù)深耕智能硬件、AI政企服務等方面的同時,不斷優(yōu)化多模態(tài)大模型、拓展AIGC商業(yè)化布局,作為國內 AIGC 領域的先驅者和踐行者,正逐步成為一家基于AIGC技術,服務于全球內容創(chuàng)作者的,一站式內容生成工具提供方。
01
技術積累:
與AIGC一脈相承的商業(yè)探索
2022年是 AIGC 元年,這是一場席卷全球的AI革命發(fā)展的必然。
早在2017年,Transformer 架構的發(fā)展改變了 NLP 技術的軌跡。GPT系列正是 OpenAI 在 NLP 領域打造的模型,從2018年第一代 GPT 的誕生到2020年 GPT-3 的脫穎而出,一場AI大模型的進化,讓圖像生成領域也醞釀了一場革新。隨著AI繪畫的爆火和 ChatGPT 的橫空出世,讓全世界看到了 AIGC 的“強大”。
AIGC為AI行業(yè)帶來一種全新的可能性和商業(yè)模式。在AIGC之前,絕大多數(shù)AI公司的商業(yè)模式都是偏ToB項目制,難以復制和規(guī)模化,人力成本高,且商業(yè)壁壘低。而AIGC讓AI公司為更多中小型企業(yè)甚至個人提供一種工具,可規(guī)模化地降本增效。
這與出門問問近年來的產(chǎn)品化思路一脈相承,出門問問在探索AI生成技術和產(chǎn)品之路上更加明確了PLG和規(guī)模化的商業(yè)模式——服務全球創(chuàng)作者,提供一站式內容生成工具。
02
戰(zhàn)略謀篇:
早于“AIGC”誕生之前的投入布局
更深的洞見和篤行,來自厚積薄發(fā)的沉淀。
“AIGC”這一名詞于2022年在全世界誕生和蓬勃,其特點和方向卻與出門問問的發(fā)展脈絡有著驚人的一致性。2022,也許大部分公司剛開始叩響AIGC的大門,而出門問問已然在這條道路上走過了一段自己的風景。
作為國內最早布局AIGC領域的公司之一,出門問問自2017年起,重點關注 Transformer 大模型進展。
2020年,出門問問深度聚焦 GPT-3,并最早著手開發(fā)了可拓展可快速優(yōu)化的中文GPT-3——多模態(tài)大模型UCLAI,于2020年推出基于UCLAI的第一款AIGC商業(yè)化產(chǎn)品——AI配音平臺「魔音工坊」,在全球范圍內獲超百萬量級的活躍用戶,開啟了AIGC商業(yè)化的序幕。
2021年,出門問問進行AIGC底層模塊化技術的開發(fā)和布局,包括文字生成語音、文字生成圖片、圖片生成視頻等,為快速尋找AI落地場景打下堅實的技術基礎。
2022年,出門問問實現(xiàn) AIGC 產(chǎn)品矩陣的全面商業(yè)化落地。基于強大的產(chǎn)品能力——算法技術中臺化,出門問問實現(xiàn)產(chǎn)品矩陣的迅速迭代及運營拓展,完整推出集AI聲音、AI寫作、AI圖片生成、聲音和形象克隆、數(shù)字人視頻制作、數(shù)字人直播等內容生成于一體的 AIGC內容SaaS 平臺。平臺擁有一站式服務、1:1高仿真克隆技術、海量數(shù)字資產(chǎn)、成熟/可信賴的商業(yè)模式等核心亮點。
03
商業(yè)落地:
打造一站式AIGC產(chǎn)品矩陣
“接下來AIGC的進一步平民化,必將改變人們的內容創(chuàng)作方式,讓消費者成為創(chuàng)作者,讓更多人借助AI來拓展智慧、知識和想象力的邊界。”出門問問創(chuàng)始人兼CEO李志飛表示。
出門問問希望將一站式AI內容生成工具打磨得更加極致,更有效地賦能廣大內容創(chuàng)作者和創(chuàng)業(yè)者,讓更多人享有AI創(chuàng)作自由、創(chuàng)造效率提升,用AI鏈接虛擬和真實世界。
AI聲音生成——魔音工坊 & DupDub
在AI聲音領域,出門問問2020年推出第一款AIGC產(chǎn)品——「魔音工坊」,海外版「DupDub」,致力于為用戶提供高品質AI配音,目前已在全球范圍內獲超百萬量級用戶。
●豐富的聲音庫,包括500+音色、10+語種和1000+聲音風格;
●強大的聲音編輯功能,包括多音字調整、語速調節(jié)、重讀、拖音等;
●媲美真人的聲音克隆:結合出門問問新一代TTS引擎 MeetHiFiVoice,最少輸入20句話,即可定制高仿真AI聲音,兼具情感遷移、跨語言遷移。
作為業(yè)界Top級配音平臺,魔音工坊與光明日報、新浪、喜馬拉雅、微信讀書、少年得到、大眾汽車集團等知名海內外多媒體平臺及企業(yè)均達成合作,是抖音、快手、頭條等各大視頻平臺擁有百萬及千萬量粉絲的大咖們的首選配音平臺。
數(shù)字形象一站式解決方案——奇妙元&元創(chuàng)島
對于面向創(chuàng)作者的數(shù)字影像領域,出門問問部署了融合“視頻生成”和“虛擬直播”的一站式解決方案。
在「奇妙元」——一款2.5D/3D 數(shù)字人視頻生成&直播平臺,用戶僅需敲敲鍵盤、輸入文本,即可一鍵創(chuàng)作惟妙惟肖的數(shù)字人視頻。
●數(shù)百量級的3D/2.5D/卡通角色;
●百余款多語種精品AI發(fā)音人;
●覆蓋全領域內容類型的場景模版,輕松賦能創(chuàng)作靈感;
●1:1高仿真聲音&形象克隆技術;
在「元創(chuàng)島」——一款3D數(shù)字人制作、數(shù)字資產(chǎn)托管服務、多種動捕驅動方案于一體的集成 SaaS 系統(tǒng),可實現(xiàn)炫酷直播、IP活化、形象克隆。為了降低廣大創(chuàng)作者的直播門檻,僅需一臺筆記本就可以實現(xiàn)半身動捕。
同時,數(shù)字形象一站式解決方案全新推出AI數(shù)字人自動播功能,輸入文案即可驅動數(shù)字人自動播報,并上線24小時數(shù)字人直播功能,代替真人不眠不休地直播,節(jié)省更多運營成本。
目前,出門問問的百變數(shù)字人已廣泛用于電商帶貨、口播視頻、娛樂主播、企業(yè)IP中,如為春秋航空定制專屬數(shù)字人形象“阿秋”、孵化出斗魚頭部萌妹主播“甜妹小給給”、為工商銀行定制數(shù)字員工。
AI寫作——魔撰
在文案生成領域,2022年出門問問推出全新AI寫作工具——「魔撰」,用AI幫助內容創(chuàng)作者更快地寫出更好的文案。
●實時糾錯并反饋可以改進的地方;
●助力頭腦風暴,續(xù)寫文章;
●AI寫作模版和智能潤色,找回遣詞造句的新鮮感;
●古今詞典、多語翻譯、文案提取等功能,讓你手握靈感,敲出不凡。
「魔撰」的布局基于出門問問在該領域長期積累的大量文案素材和沉淀用戶數(shù)據(jù),建立了堅實的生態(tài)壁壘和產(chǎn)品競爭力。
AI圖片生成——言之畫
2022年AI繪畫爆火,創(chuàng)意十足的吸睛圖片也成為很多廣告創(chuàng)意、游戲行業(yè)從業(yè)者的剛需。出門問問推出面向全球游戲廣告行業(yè)的「言之畫」——一款可快速生成爆款廣告素材,智能輔助游戲設計的AI圖片生成平臺。
言之畫具有“文本生成圖片”、“文本及圖片生成圖片”、“定制模型”等功能,支持現(xiàn)代風格、古風、二次元風格等多種風格和視角的高精準垂直內容,可提高內容二次創(chuàng)作度。
目前,多家知名游戲及廣告創(chuàng)意公司已與「言之畫」達成深入合作。
聲音&形象克隆
當真實與虛擬相融,我們與數(shù)字未來的距離越來越近,如何“復刻”世界的另一個自己?出門問問重拳鍛造業(yè)界領先的「數(shù)字克隆人」定制業(yè)務,精耕形象克隆和聲音克隆,致力于創(chuàng)建在虛擬世界的個人數(shù)字資產(chǎn),讓每個人遇見“更好”的自己。
形象克隆可基于一段記錄真人的表情和肢體動作的5分鐘視頻,以1:1高仿真克隆技術還原真人的容貌、嘴型、表情、肢體動作和聲音。
聲音克隆最短只需錄制20句話,在小時級別內即可獲得聲音模型,同時可以在不額外錄制數(shù)據(jù)的情況下,讓聲音擁有豐富的情感以及多語言能力。
目前克隆業(yè)務正在火熱開展,已為多領域行業(yè)標桿克隆定制數(shù)字人,并與行業(yè)內聲優(yōu)大咖聯(lián)合定制個性化音色,碰撞出更多創(chuàng)作火花。
04
全球化布局
出門問問在積極布局AIGC的全球化。
AIGC產(chǎn)品沒有地域限制,具有天然的全球化性質,出門問問將延續(xù)自身軟硬結合產(chǎn)品的全球化發(fā)展路徑,利用一流的國際化視野、團隊和出海經(jīng)驗,布局國際化市場。同時,海外已有同類AIGC產(chǎn)品,也為出門問問的產(chǎn)品出海奠定了深厚的用戶基礎。
此外,國內互聯(lián)網(wǎng)場景應用較國外深入,已讓出門問問開發(fā)的視頻內容AIGC工具具有很強的行業(yè)領先地位和用戶基礎。2022年,出門問問的「魔音工坊」海外版 DupDub 已實現(xiàn)國際布局,更多AIGC系列產(chǎn)品從規(guī)劃之初即以全球化發(fā)展作為基本方向。
結語
AIGC的一小步,卻是人類文明的一大步。
2022年,AIGC正重塑內容生產(chǎn)方式,推動人類生產(chǎn)關系的變革。
出門問問堅信這項技術的革命性力量。而模型覆蓋音頻、圖像、文本、視頻、直播等多模態(tài)的內容生成能力,讓出門問問成為目前國內 AIGC 領域布局最全面的公司之一。未來,出門問問將持續(xù)探索AIGC和生成式AI,為全球用戶實現(xiàn)AIGC創(chuàng)作打造更多有價值的應用,讓AIGC更好地激發(fā)人類靈感,讓“人機”互相成就,領跑下一代AIGC大局。
AIGC本身也是一場技術、產(chǎn)品、商業(yè)的軍備競賽,而AI的邊界在哪里,需要我們一起探索。正如出門問問所期待的,AIGC 并不是終局目的,對「定義下一代人機交互」這一愿景的踐行才是最核心的目標。
2022,出門問問始終在路上。