AI新聞播報、智能客服通話、車載語音導航、智能家居對話......當下,通過語音實現的人機交互,已經在生活里無處不在。不止于能說話,各類應用還越來越會說話,說“好聽”的話!
為了實現用戶對高質量音效的追求,近日,標貝科技語音合成服務再次升級,重磅推出24K高保真合成音色,包括4個有聲閱讀發音人及1個智能客服發音人,滿足更多細分場景的應用。
實際上,標貝此次推出的全新音色采用24K采樣(現有聲音為16k和8K),在飽滿程度有很大提升,再配合標貝語音合成本身良好的情感表現力,讓用戶聽到的每句話都細膩生動、充滿活力,為用戶打造沉浸式AI語音交互體驗。
“新舊聲音對比來聽,會明顯感受到音質的差距。更高采樣率,在標貝最新的TTS系統下更富有表現力。”標貝科技語音產品負責人介紹,“當前不管是有聲讀物還是影視配音,大部分還是采用提前錄音的方式,盡可能讓語音包更好聽,但這樣一來,制作的周期長成本大,內容的覆蓋率也不高,而通過24K高質量的合成音色來生成音頻內容,不僅能保證聲音效果,還能實現動態輸出、按需定制。”
領先智能語音技術 推動智能語音產業規模化發展
當前,智能化、大數據時代的到來,全球人工智能行業展現出蓬勃生機,我國智能語音產業也保持快速增長態勢。據中國語音產業聯盟發布《2020-2021中國語音產業發展白皮書》統計,2020年市場規模達217億元,較2019年同比增長31%,預計2021年可達到285億元,同比增速達到44%。
作為智能語音行業代表品牌之一,標貝科技深耕智能語音交互領域多年,始終致力于語音技術的創新研發和商業化應用。隨著自身技術不斷迭代升級以及音色庫逐步豐富,標貝智能語音性能已能媲美真人效果,覆蓋超過100余種不同語言和場景的自有版權商業化音色,支持中文、英文、中英混讀、小語種、方言等語種,充分滿足智能客服、媒體新聞、有聲閱讀、車載互聯、泛娛樂等領域語音需求。
為進一步拓寬智能語音使用場景,滿足各行業客戶的多元化需求,標貝科技持續探索新的服務和能力。
一方面,堅持技術和產品層面的創新,推出高品質通用語音方案和特色語音定制服務,打造極致的用戶體驗:
▌聲音復刻方案,能克隆人的聲音,只需要花費5分鐘錄制10個小片段,即可將自己或者想要的聲音復刻下來,和自己喜歡的聲音對話。
▌聲音轉換方案,能像柯南的領結一樣,在保留原說話人的語氣、語調、停頓的基礎上,將原說話人的聲音完美轉換成另一個人的聲音。
▌情感合成方案,讓智能設備能“哭”會“笑”,像真人一樣在語氣、語調、情緒等方面表現自己,做出高興、生氣、悲傷、驚奇、恐懼、厭惡六種不同的情感表達。
▌離在線融合技術,用戶在網絡不穩定情況下,也能實現離線、在線合成兩種模式的靈活切換,同時兼顧合成音色質量和響應速度的雙重要求,提高人機交互的便利。
另一方面,標貝科技通過智能語音開放平臺為開發者提供一站式場景應用的語音技術支持,使用者不需要深入理解語音交互原理,通過簡單易用的SDK和API的接入,在管理平臺創建應用服務,即可靈活調用各項技術服務,進行個性化語音交互功能開發。
隨著人工智能應用的普及以及基礎設施成熟,智能語音作為人機交互的重要入口,迎來大規模商業化落地階段。標貝科技將繼續以技術創新為核心,以市場需求為導向,通過一系列實踐,打磨出適用更多場景、更優性能的語音方案,為用戶提供更高效便捷的體驗。