【ITBEAR】近日,字節(jié)跳動旗下火山引擎發(fā)布了兩款引人注目的AI視頻模型——豆包視頻生成PixelDance和Seaweed。這兩款模型在語義理解、復(fù)雜交互畫面處理以及多鏡頭內(nèi)容一致性上取得了重大突破,顯著提升了AI視頻的連貫性和真實感,能夠生成連續(xù)動作的人物表演視頻,并支持多鏡頭組合,展現(xiàn)出極致的運鏡控制能力。
豆包大模型的使用量正快速增長,日均tokens使用量已超過1.3萬億,顯示出其產(chǎn)品能力的日益完善和市場需求的強勁增長。
火山引擎披露,豆包語言模型的日均tokens使用量不僅龐大,其多模態(tài)數(shù)據(jù)處理量也達到了每天5000萬張圖片和85萬小時語音。這一系列成就標志著AI多模態(tài)產(chǎn)業(yè)鏈正迎來新的發(fā)展機遇,該產(chǎn)業(yè)鏈涵蓋了AI視頻模型、IP及視頻應(yīng)用、視頻營銷代理商等多個環(huán)節(jié),涉及萬興科技、信雅達等多家企業(yè)。
豆包AI視頻模型以其全新特點,在連續(xù)動作的人物表演、多鏡頭組合視頻以及極致的運鏡控制方面展現(xiàn)了非凡的能力,為AI多模態(tài)的應(yīng)用開啟了新的篇章。
隨著豆包大模型的日益成熟和廣泛應(yīng)用,AI多模態(tài)領(lǐng)域有望迎來爆發(fā)期,為相關(guān)行業(yè)帶來深刻的變革和發(fā)展機遇。