9月23日,2022萬象·百度移動生態(tài)大會在廣東珠海召開。百度發(fā)布多項AIGC應用內容生產領域的技術和產品,吸引大量創(chuàng)作者和行業(yè)人士關注。
會上,百度移動生態(tài)帶來了搜索技術革新、AIGC(人工智能生成內容)輔助創(chuàng)作等方面的創(chuàng)新,尤其是“創(chuàng)作者AI助理團”和“百度APP數字人計劃”的發(fā)布,助力內容創(chuàng)作駛進AIGC元年。百度集團資深副總裁、百度移動生態(tài)事業(yè)群組(MEG)總經理何俊杰表示,百度移動生態(tài)是百度人工智能技術落地的“首站”,AI技術能用盡用、能出盡出,AIGC將在移動生態(tài)大規(guī)模落地。這背后飛槳文心大模型提供了強大的底層技術能力。
文心一格生成的萬象大會現場演講海報
創(chuàng)作者AI助理團發(fā)布,助力AIGC智能創(chuàng)作
在大會現場,百度推出“創(chuàng)作者AI助理團”,依托飛槳文心大模型、飛槳文心一格、圖文轉視頻等技術,創(chuàng)作者可以通過“AI文案助理”、“AI插畫助理”、“AI視頻制作助理”三大功能,實現“一個人成為一支隊伍”的轉變,這也是文心大模型在百度內部業(yè)務的重要落地成果。
創(chuàng)作者AI助理團發(fā)布,文心大模型提供技術支持
具體來看,“AI文案助理”基于百度文心大模型,可以根據創(chuàng)作者的需求快速產出不同風格的文章標題、內容段落。同時,在飛槳文心一格的支持下,“Al插畫助理”可以根據輸入的關鍵詞,自動“畫”出十余種不同風格的畫作,幫助創(chuàng)作者實現“配圖自由”。
此外,“AI視頻制作助理”利用多模態(tài)AI處理技術,實現行圖文自動生成視頻能力,速度已可達“分鐘級”。據悉,這項技術將圖文到視頻的創(chuàng)作周期縮短超3倍,而且也為創(chuàng)作者帶來“一篇內容,兩種收益”的效果。
零門檻新場景,激發(fā)藝術想象空間
近年來,Al逐漸從理解語言、理解文字、理解圖片和視頻,走向AI生成內容。可以預見,AIGC也將在移動生態(tài)進行大規(guī)模落地,而文心大模型將成為推動AIGC發(fā)展的新引擎。
大會期間,由度曉曉作詞作曲演唱的MV《啟航星》正式上線,成為首支全AIGC生成的MV。據介紹,此次MV視頻依托百度推出的AI藝術和創(chuàng)意輔助平臺——文心一格,根據歌詞自動生成畫面。
首支全AIGC生成MV《啟航星》,文心一格支持畫面自動生成
面對MV對圖片的高質量需求,如何準確理解歌詞內容,進而精準刻畫并維持統(tǒng)一的畫面風格,高質量生成系列畫作是技術要解決的關鍵挑戰(zhàn)。文心一格依托百度在跨模態(tài)大模型技術與系統(tǒng)的創(chuàng)新,研發(fā)了支持AI作畫的文生圖系統(tǒng),降低了用戶輸入描述成本,支持十余種不同風格畫作的生成,最終自動選出語義與美觀度最佳的畫作。
“萬象大會”百度APP小程序,移動端體驗文心一格AI作畫
值得一提的是,目前用戶已經可以在移動端體驗文心一格AI作畫。在今年萬象大會推出的“AI共創(chuàng)展”中,用戶只需進入“萬象大會”的百度APP小程序,輸入創(chuàng)作關鍵詞,并選擇期望的畫作想象和風格,就能快速獲取由文心一格生成的相應畫作,親身體驗零門檻繪畫創(chuàng)作的樂趣。
除了畫面的AI生成,度曉曉的歌聲也是基于百度最新研發(fā)的高質量歌唱合成技術打造。通過采用業(yè)內首創(chuàng)的雙信息編碼框架,分別對歌詞信息和樂律信息進行獨立編碼,可以實現對歌詞、樂律細粒度控制的效果。在這樣的技術支持下,度曉曉就可以充分學習不同發(fā)音人的演唱技巧,支持少量數據的任意聲線演唱,并實現歌唱能力的快速定制。
當下,隨著AI技術的成熟,AIGC正成為越來越重要的新型內容生產方式。百度移動生態(tài)業(yè)務正不斷走向新階段,文心大模型作為背后的重要技術支撐之一,將持續(xù)助力百度實現內容生產智能化升級,構建更加多元開放的內容生態(tài),為內容創(chuàng)作者帶來更多價值紅利。