當(dāng)前,AI大模型無疑是產(chǎn)業(yè)界最炙手可熱的話題。9月初,隨著百度文心一言和阿里通義千問開放注冊,騰訊也發(fā)布了其混元大模型,國內(nèi)通用大模型的江湖格局業(yè)已形成。但這似乎只是開始,緊跟著這些通用大模型的節(jié)奏,行業(yè)大模型也開始批量面市。
近日,新壹科技宣布其視頻大模型通過境內(nèi)深度合成服務(wù)算法備案信息備案,用戶可以登錄新壹科技官網(wǎng),使用秒創(chuàng)等產(chǎn)品體驗(yàn)新壹視頻大模型在圖文生成、視頻生成、數(shù)字人播報(bào)等領(lǐng)域的功能。不難看出,行業(yè)大模型將成為未來大模型發(fā)展的重點(diǎn)。
新壹科技是國內(nèi)領(lǐng)先的人工智能生成視頻應(yīng)用和技術(shù)服務(wù)商,公司以人工智能為驅(qū)動,在視頻生成、視頻垂直行業(yè)大模型、數(shù)字人、VR等方面已經(jīng)取得了系列創(chuàng)新成果。2023年7月27日,新壹科技發(fā)布了國內(nèi)首款聚焦視頻領(lǐng)域的人工智能大模型——新壹視頻大模型。新壹視頻大模型是以視頻生成為核心的AIGC模型,擁有從腳本生成、素材匹配、素材生產(chǎn)、智能剪輯、配音到數(shù)字人播報(bào)的全流程AI視頻生產(chǎn)能力。
新壹視頻大模型具備多模態(tài)的感知、實(shí)時學(xué)習(xí)、自迭代及多場景交叉推理的核心內(nèi)容能力。可以處理多模態(tài)的輸入信息,包括理解文字的意義、識別圖像的內(nèi)容和感知音樂的情緒,基于對內(nèi)容生產(chǎn)準(zhǔn)確的理解去生成視頻。其能夠輔助各行業(yè)視頻創(chuàng)作者構(gòu)筑高效智能、專業(yè)安全的創(chuàng)作體系,并可接駁營銷機(jī)構(gòu)、零售電商、文旅餐飲、金融保險(xiǎn)等多個行業(yè)的落地應(yīng)用場景,提供可靠的系統(tǒng)性解決方案。
基于新壹視頻大模型,新壹科技推出了行業(yè)領(lǐng)先智能內(nèi)容生成平臺——秒創(chuàng)。秒創(chuàng)為用戶提供AI生成服務(wù),包括AI文稿生成、文字轉(zhuǎn)語音、文生圖、圖文轉(zhuǎn)視頻等創(chuàng)作服務(wù),通過對文案、素材、AI語音、字幕等進(jìn)行智能分析解構(gòu),助力創(chuàng)作者快速成片,實(shí)現(xiàn)零門檻產(chǎn)出視頻。此外,秒創(chuàng)還提供數(shù)字人定制服務(wù),支持真人或者卡通多種風(fēng)格形象定制,生成數(shù)字人之后,還可以進(jìn)行內(nèi)容播報(bào),接下來新壹科技也將提供數(shù)字人直播功能服務(wù)。
訓(xùn)練數(shù)字人時的工作場景
在新壹科技CEO雷濤看來,以目前技術(shù)發(fā)展階段來看,數(shù)字人還只能承擔(dān)邊緣性的人物角色,同時數(shù)字人在影視領(lǐng)域大規(guī)模落地還有很長的路要走。對于目前數(shù)字人在電商直播、養(yǎng)老等領(lǐng)域落地,雷濤指出,數(shù)字人目前還不能完成真人在直播間中銷售的全流程工作,同時真正起到對老人的陪伴作用仍需技術(shù)上的攻克,“目前行業(yè)設(shè)想的許多場景,離真正實(shí)現(xiàn)仍有一段距離。”