【ITBEAR】在合肥奧體中心,第七屆世界聲博會暨科大訊飛全球1024開發者節盛大開幕,科大訊飛借此機會展示了其最新的多模態視覺交互技術和超擬人數字人。這一創新不僅震撼了行業,也預示著數字人技術的新篇章。
科大訊飛研究院院長劉聰在活動現場演示了如何通過一張照片快速生成超擬人數字人,這一技術極大簡化了數字人的定制流程,降低了應用門檻。用戶只需上傳個人照片,便能獲得一個高度擬真的數字人形象。
除了形象定制,科大訊飛還推出了情感貫穿的多模態交互技術,使數字人能夠根據語境實時調整表情,實現更自然的情感表達。這一技術讓數字人的面部表情更加生動,情感傳遞更加準確。
在肢體動作驅動方面,科大訊飛也實現了技術創新。超擬人數字人的肢體動作能夠根據語音的節奏、語調和內容實時生成,擺脫了預設模板動作的限制,提升了數字人在動態場景中的表現力。
科大訊飛還采用了中間表征壓縮技術,提升了數字人在多場景下的實時交互能力。這一技術有效壓縮了視頻維度,減少了計算量,保障了數字人與用戶的實時互動。
科大訊飛數字人技術已廣泛應用于金融、政務、文旅、商業、展會等多個領域。訊飛智作作為智能內容創作基地,結合星火認知大模型,為用戶提供一站式的虛擬人解決方案,降低了服務成本,提升了用戶體驗。
目前,首發超擬人虛擬人的內測通道已在訊飛智作小程序上開放。依托星火大模型的基座能力,用戶可以實現任意一張照片的快速驅動生成,定制屬于自己的超擬人數字人。