AI新聞播報(bào)、智能客服通話、車載語(yǔ)音導(dǎo)航、智能家居對(duì)話......當(dāng)下,通過語(yǔ)音實(shí)現(xiàn)的人機(jī)交互,已經(jīng)在生活里無(wú)處不在。不止于能說話,各類應(yīng)用還越來(lái)越會(huì)說話,說“好聽”的話!
為了實(shí)現(xiàn)用戶對(duì)高質(zhì)量音效的追求,近日,標(biāo)貝科技語(yǔ)音合成服務(wù)再次升級(jí),重磅推出24K高保真合成音色,包括4個(gè)有聲閱讀發(fā)音人及1個(gè)智能客服發(fā)音人,滿足更多細(xì)分場(chǎng)景的應(yīng)用。
實(shí)際上,標(biāo)貝此次推出的全新音色采用24K采樣(現(xiàn)有聲音為16k和8K),在飽滿程度有很大提升,再配合標(biāo)貝語(yǔ)音合成本身良好的情感表現(xiàn)力,讓用戶聽到的每句話都細(xì)膩生動(dòng)、充滿活力,為用戶打造沉浸式AI語(yǔ)音交互體驗(yàn)。
“新舊聲音對(duì)比來(lái)聽,會(huì)明顯感受到音質(zhì)的差距。更高采樣率,在標(biāo)貝最新的TTS系統(tǒng)下更富有表現(xiàn)力。”標(biāo)貝科技語(yǔ)音產(chǎn)品負(fù)責(zé)人介紹,“當(dāng)前不管是有聲讀物還是影視配音,大部分還是采用提前錄音的方式,盡可能讓語(yǔ)音包更好聽,但這樣一來(lái),制作的周期長(zhǎng)成本大,內(nèi)容的覆蓋率也不高,而通過24K高質(zhì)量的合成音色來(lái)生成音頻內(nèi)容,不僅能保證聲音效果,還能實(shí)現(xiàn)動(dòng)態(tài)輸出、按需定制。”
領(lǐng)先智能語(yǔ)音技術(shù) 推動(dòng)智能語(yǔ)音產(chǎn)業(yè)規(guī)模化發(fā)展
當(dāng)前,智能化、大數(shù)據(jù)時(shí)代的到來(lái),全球人工智能行業(yè)展現(xiàn)出蓬勃生機(jī),我國(guó)智能語(yǔ)音產(chǎn)業(yè)也保持快速增長(zhǎng)態(tài)勢(shì)。據(jù)中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟發(fā)布《2020-2021中國(guó)語(yǔ)音產(chǎn)業(yè)發(fā)展白皮書》統(tǒng)計(jì),2020年市場(chǎng)規(guī)模達(dá)217億元,較2019年同比增長(zhǎng)31%,預(yù)計(jì)2021年可達(dá)到285億元,同比增速達(dá)到44%。
作為智能語(yǔ)音行業(yè)代表品牌之一,標(biāo)貝科技深耕智能語(yǔ)音交互領(lǐng)域多年,始終致力于語(yǔ)音技術(shù)的創(chuàng)新研發(fā)和商業(yè)化應(yīng)用。隨著自身技術(shù)不斷迭代升級(jí)以及音色庫(kù)逐步豐富,標(biāo)貝智能語(yǔ)音性能已能媲美真人效果,覆蓋超過100余種不同語(yǔ)言和場(chǎng)景的自有版權(quán)商業(yè)化音色,支持中文、英文、中英混讀、小語(yǔ)種、方言等語(yǔ)種,充分滿足智能客服、媒體新聞、有聲閱讀、車載互聯(lián)、泛娛樂等領(lǐng)域語(yǔ)音需求。
為進(jìn)一步拓寬智能語(yǔ)音使用場(chǎng)景,滿足各行業(yè)客戶的多元化需求,標(biāo)貝科技持續(xù)探索新的服務(wù)和能力。
一方面,堅(jiān)持技術(shù)和產(chǎn)品層面的創(chuàng)新,推出高品質(zhì)通用語(yǔ)音方案和特色語(yǔ)音定制服務(wù),打造極致的用戶體驗(yàn):
▌聲音復(fù)刻方案,能克隆人的聲音,只需要花費(fèi)5分鐘錄制10個(gè)小片段,即可將自己或者想要的聲音復(fù)刻下來(lái),和自己喜歡的聲音對(duì)話。
▌聲音轉(zhuǎn)換方案,能像柯南的領(lǐng)結(jié)一樣,在保留原說話人的語(yǔ)氣、語(yǔ)調(diào)、停頓的基礎(chǔ)上,將原說話人的聲音完美轉(zhuǎn)換成另一個(gè)人的聲音。
▌情感合成方案,讓智能設(shè)備能“哭”會(huì)“笑”,像真人一樣在語(yǔ)氣、語(yǔ)調(diào)、情緒等方面表現(xiàn)自己,做出高興、生氣、悲傷、驚奇、恐懼、厭惡六種不同的情感表達(dá)。
▌離在線融合技術(shù),用戶在網(wǎng)絡(luò)不穩(wěn)定情況下,也能實(shí)現(xiàn)離線、在線合成兩種模式的靈活切換,同時(shí)兼顧合成音色質(zhì)量和響應(yīng)速度的雙重要求,提高人機(jī)交互的便利。
另一方面,標(biāo)貝科技通過智能語(yǔ)音開放平臺(tái)為開發(fā)者提供一站式場(chǎng)景應(yīng)用的語(yǔ)音技術(shù)支持,使用者不需要深入理解語(yǔ)音交互原理,通過簡(jiǎn)單易用的SDK和API的接入,在管理平臺(tái)創(chuàng)建應(yīng)用服務(wù),即可靈活調(diào)用各項(xiàng)技術(shù)服務(wù),進(jìn)行個(gè)性化語(yǔ)音交互功能開發(fā)。
隨著人工智能應(yīng)用的普及以及基礎(chǔ)設(shè)施成熟,智能語(yǔ)音作為人機(jī)交互的重要入口,迎來(lái)大規(guī)模商業(yè)化落地階段。標(biāo)貝科技將繼續(xù)以技術(shù)創(chuàng)新為核心,以市場(chǎng)需求為導(dǎo)向,通過一系列實(shí)踐,打磨出適用更多場(chǎng)景、更優(yōu)性能的語(yǔ)音方案,為用戶提供更高效便捷的體驗(yàn)。