1月13日,百度AI官方視頻號發(fā)布了一條特殊的視頻——《百度研究院2021年十大科技趨勢預(yù)測》,該視頻完全由AI自動剪輯生成,制作者只需一鍵輸入新聞鏈接即可生成視頻。其中,起到關(guān)鍵支撐的是百度大腦圖文轉(zhuǎn)視頻技術(shù)(VidPress)。
此前,該技術(shù)也已應(yīng)用于人民日報對外推出的“人民日報創(chuàng)作大腦”產(chǎn)品。該產(chǎn)品旨在為內(nèi)容生產(chǎn)全面賦能,運用人工智能等技術(shù)為媒體機構(gòu)和內(nèi)容創(chuàng)作者提供通用型創(chuàng)作工具,提升內(nèi)容生產(chǎn)和分發(fā)效率,助力媒體深度融合。當前,在人工智能、5G、云計算、大數(shù)據(jù)等技術(shù)驅(qū)動帶來更豐富的多媒體內(nèi)容、傳播視頻化成為媒體內(nèi)容進化的行業(yè)大趨勢下,媒體行業(yè)也在加快智能升級的步伐。
基于百度強大的人工智能技術(shù),“人民日報創(chuàng)作大腦”推出新聞轉(zhuǎn)視頻、直播剪輯、智能寫作、新聞追蹤數(shù)據(jù)、媒體訂閱數(shù)據(jù)、智能配音等在內(nèi)的18項智能生產(chǎn)工具,覆蓋媒體策、采、編、發(fā)的全流程。而得到大家廣泛關(guān)注的新聞轉(zhuǎn)視頻工具就是基于百度大腦圖文轉(zhuǎn)視頻技術(shù)(VidPress)打造,我們一起來深入了解下這項強大的技術(shù)。
圖文轉(zhuǎn)視頻(VidPress)是在2020年初由百度研究院孵化推出,是業(yè)界首個支撐通用型、大規(guī)模的全自動視頻生產(chǎn)技術(shù)。它的價值在于利用算法和AI模型自動進行故事線生成,降低素材搜集、整理、匹配、剪輯的時間成本,實現(xiàn)全自動智能化新聞視頻內(nèi)容生產(chǎn)。用戶可零門檻快速上手,通過圖文鏈接一鍵導入,自動實現(xiàn)配音、字幕、畫面的視頻內(nèi)容生產(chǎn),極大提升了視頻制作全流程的效率,滿足從小白新手到專業(yè)視頻創(chuàng)作者的視頻制作需求。
貫穿視頻生產(chǎn)全流程,四大核心優(yōu)勢提供一站式服務(wù)
圖文轉(zhuǎn)視頻(VidPress)擁有功能操作簡單、完整視頻生產(chǎn)服務(wù)、可預(yù)置視頻素材庫和靈活搭建應(yīng)用平臺四大核心優(yōu)勢,可快速實現(xiàn)短視頻內(nèi)容生產(chǎn):
操作方面實現(xiàn)0基礎(chǔ)上手,普通用戶、媒體創(chuàng)作者通過上傳Word稿件、新聞網(wǎng)址,即可在幾分鐘內(nèi)完成短視頻內(nèi)容生產(chǎn)。
提供完整的視頻生產(chǎn)服務(wù),可自動完成素材的聚合、匹配與解說詞生成,提供10+種不同風格的男女聲AI語音播報,并完成字幕的自動合成,還支持自定義上傳角標、片頭和片尾。
在素材豐富度上,圖文轉(zhuǎn)視頻(VidPress)可以預(yù)置視頻素材庫,能夠支持多種類型的媒體素材導入方式,滿足視頻素材庫深度定制需求,幫助用戶迅速建立自有媒體素材庫。
提供全套API技術(shù)能力,用戶可以根據(jù)自己的需求,自由搭建視頻生產(chǎn)應(yīng)用平臺,大幅降低視頻生產(chǎn)研發(fā)門檻,提升視頻創(chuàng)作的效率。
領(lǐng)先技術(shù)帶來“智”能流暢體驗,大幅提升制作分發(fā)效率
圖文轉(zhuǎn)視頻(VidPress)詮釋的視頻生產(chǎn)方式,足以用“智能”一詞來形容,媒體創(chuàng)作者可以從通稿式“標準”內(nèi)容,一鍵轉(zhuǎn)化為快訊、短視頻等多樣化形態(tài),分發(fā)至不同平臺、不同受眾,目前圖文轉(zhuǎn)視頻(VidPress)生產(chǎn)一條視頻僅需要幾分鐘,用低成本創(chuàng)作高品質(zhì)的媒體內(nèi)容,大幅提升媒體工作者的創(chuàng)作效率。
為實現(xiàn)上述能力,圖文轉(zhuǎn)視頻(VidPress)實現(xiàn)了一套完整的基于解說摘要生成、語音合成、視覺素材提取與理解、音視頻對齊的短視頻自動生成的技術(shù)框架。可低成本、高時效、大批量、高質(zhì)量地制作短視頻。
在核心技術(shù)方面,圖文轉(zhuǎn)視頻(VidPress)具有行業(yè)領(lǐng)先的視頻場景解說摘要生成、視覺素材提取、視覺內(nèi)容理解、音視頻內(nèi)容自動對齊等技術(shù),目前已獲得面向視頻場景的解說摘要生成、主圖視覺素材搜索等多項創(chuàng)新技術(shù)和AI算法專利,利用核心技術(shù)提升機器視頻制作效率和質(zhì)量。
圖文轉(zhuǎn)視頻(VidPress)已在百度百家號、百度好看視頻大規(guī)模投放使用,生成一個時長2分鐘的視頻,制作時間僅需要5分鐘,整個過程從熱點新聞發(fā)現(xiàn)到最終的視頻生成,實現(xiàn)無人化、自動化,顯著提升人工剪輯短視頻的生產(chǎn)效率。
積極探索媒體創(chuàng)新與應(yīng)用,AI帶來無限拓展可能
截止目前,百度大腦圖文轉(zhuǎn)視頻(VidPress)已累積生產(chǎn)近50萬條視頻,成為被廣泛應(yīng)用的工具,并助力“人民日報創(chuàng)作大腦”全新發(fā)布。接下來,百度大腦圖文轉(zhuǎn)視頻(VidPress)將會繼續(xù)深入優(yōu)化自動化視頻生成算法,提升視頻生成質(zhì)量和效率,并將提供面向體育、知識等不同領(lǐng)域和垂類的短視頻生產(chǎn)服務(wù)。
未來,多模態(tài)圖文轉(zhuǎn)換將會面對更多自動化生產(chǎn)需求,以適應(yīng)新聞、電商、各垂類自媒體等需要時效性、低成本推廣的訴求。通過從上游連接文本生成、資訊熱點發(fā)現(xiàn),下游連接自動化發(fā)布、審核、推廣等環(huán)節(jié),打通自動化視頻內(nèi)容生產(chǎn)系統(tǒng)的任督二脈,大幅降低視頻生產(chǎn)環(huán)節(jié)對人力的依賴。
百度大腦圖文轉(zhuǎn)視頻(VidPress)在“人民日報創(chuàng)作大腦”產(chǎn)品中率先落地,標志著百度正將先進的人工智能技術(shù)賦能媒體生產(chǎn)。未來,以百度大腦圖文轉(zhuǎn)視頻(VidPress)為代表的AI技術(shù)將更深刻的變革媒體及更多行業(yè)的作業(yè)模式,加速推進媒體產(chǎn)業(yè)的智能化進程和全國新聞媒體的深度融合發(fā)展。