在數(shù)字化閱讀的浪潮中,有聲閱讀正逐步邁向工業(yè)化與智能化的全新階段。細(xì)節(jié)決定體驗(yàn),無(wú)論是書(shū)籍的動(dòng)態(tài)效果還是聽(tīng)書(shū)的音色質(zhì)感,都成為了影響用戶數(shù)字閱讀感受的關(guān)鍵因素。華為閱讀App,作為一款注重用戶體驗(yàn)的數(shù)字閱讀平臺(tái),在HarmonyOS NEXT系統(tǒng)上推出了8款高度仿真的聽(tīng)書(shū)音色,為用戶帶來(lái)了近乎真人朗讀般的情感體驗(yàn)。
為了進(jìn)一步提升聽(tīng)書(shū)體驗(yàn),華為閱讀近期升級(jí)了精品音色3.0版本。這一升級(jí)背后,是基于40萬(wàn)小時(shí)以上高質(zhì)量數(shù)據(jù)的深度訓(xùn)練。從韻律的把握、情感的融入,到風(fēng)格的多樣化,華為閱讀致力于為用戶呈現(xiàn)一個(gè)高度擬人化、富有共情能力及風(fēng)格切換自如的聽(tīng)覺(jué)盛宴。這些訓(xùn)練數(shù)據(jù)不僅豐富了音色的表現(xiàn)力,更使其具備了在不同閱讀場(chǎng)景下靈活切換的能力。
精品音色3.0的打造,得益于華為閱讀與中國(guó)傳媒大學(xué)的深度合作。中國(guó)傳媒大學(xué)視聽(tīng)技術(shù)與智能控制系統(tǒng)文化和旅游部重點(diǎn)實(shí)驗(yàn)室的研究員、播音主持藝術(shù)學(xué)院副教授王宇紅,為華為閱讀提供了專業(yè)的聲音素材。這些素材源自實(shí)驗(yàn)室研發(fā)的“藝術(shù)+技術(shù)情感體系”,通過(guò)破解智能語(yǔ)音交互中的多種情境,錄制了大量高質(zhì)量的語(yǔ)料數(shù)據(jù)集。借助人工智能合成技術(shù),這些機(jī)械聲音被賦予了人性化的溫度,讓聽(tīng)書(shū)體驗(yàn)更加貼近真人朗讀。
華為閱讀精品音色3.0采用了先進(jìn)的TTS技術(shù),即文字轉(zhuǎn)語(yǔ)音技術(shù)。該技術(shù)以華為的語(yǔ)音大模型為核心,結(jié)合實(shí)驗(yàn)室研發(fā)的“藝術(shù)+技術(shù)情感體系”,通過(guò)40萬(wàn)小時(shí)以上大數(shù)據(jù)的訓(xùn)練與優(yōu)化,實(shí)現(xiàn)了對(duì)人類語(yǔ)音的精準(zhǔn)建模。王宇紅副教授作為專業(yè)演播員的音色細(xì)節(jié),在技術(shù)手段的保留和還原下,展現(xiàn)出了韻律豐富、重點(diǎn)突出、識(shí)別力強(qiáng)的特點(diǎn)。這種逼真音色不僅提高了信息傳遞的效率,更為用戶帶來(lái)了身臨其境的聽(tīng)書(shū)體驗(yàn)。
王宇紅副教授在錄制過(guò)程中,充分發(fā)揮了自己30年的媒體教學(xué)與播音實(shí)踐經(jīng)驗(yàn)。她結(jié)合數(shù)字化時(shí)代有聲語(yǔ)言的個(gè)性化優(yōu)勢(shì),兼顧了智能語(yǔ)音的“傳播語(yǔ)境擬態(tài)化”、“音色特征通用性”、“感官體驗(yàn)交流感”以及“閱讀內(nèi)容通識(shí)性”等特點(diǎn)。錄制時(shí)的吐字清晰、發(fā)音標(biāo)準(zhǔn)、語(yǔ)氣語(yǔ)調(diào)豐富多樣,將演播者對(duì)文字的理解與感受轉(zhuǎn)化為有助于構(gòu)建讀者心理體驗(yàn)的停連、重音、語(yǔ)氣和節(jié)奏。同時(shí),她還注重在聲音傳達(dá)中建立與用戶的“交流感”,使精品聲音在華為閱讀的技術(shù)轉(zhuǎn)化下,能夠適配不同的讀物需求和聽(tīng)書(shū)場(chǎng)景。
無(wú)論是駕駛時(shí)的專注需求、睡前的放松氛圍,還是兒童讀物的親切與啟智特性,華為閱讀精品音色3.0都能為用戶提供高度擬人化、具有共情能力和風(fēng)格切換自如的聲音體驗(yàn)。這一創(chuàng)新不僅引領(lǐng)了數(shù)字閱讀的情感化趨勢(shì),更為用戶帶來(lái)了更加豐富的聽(tīng)覺(jué)享受。