聽(tīng)說(shuō)新疆又上熱搜了。
當(dāng)然,這次還是因?yàn)閭髡f(shuō)中神秘的“喀納斯水怪”。
雖然最后景區(qū)工作人員回應(yīng)了水中黑影是哲羅鮭,否認(rèn)了“水怪”的說(shuō)法。但是并不妨礙人們對(duì)于神秘、美麗的新疆喀納斯的向往。
近年來(lái),隨著“一帶一路”發(fā)展戰(zhàn)略的推進(jìn),擁有極其豐富資源的新疆作為“絲綢之路經(jīng)濟(jì)帶”核心地區(qū),已經(jīng)成為我國(guó)西部地區(qū)經(jīng)濟(jì)增長(zhǎng)重要支點(diǎn),與其他民族之間的交融與日俱增,越來(lái)越多的人開(kāi)始了解新疆。
新疆作為我國(guó)少數(shù)民族自治區(qū),近50%的人口是維吾爾族,以維吾爾語(yǔ)為其主要使用語(yǔ)言,其中有很大一部分人不懂得漢語(yǔ)。
隨著AI的飛速發(fā)展,應(yīng)用場(chǎng)景不斷擴(kuò)展,智能語(yǔ)音設(shè)備無(wú)處不在,對(duì)于方言語(yǔ)音識(shí)別的需求也在日漸增加。為了讓維吾爾族民眾也能夠享受人工智能、大數(shù)據(jù)、云計(jì)算等新技術(shù)為工作生活所帶來(lái)的便利,標(biāo)貝科技基于深度學(xué)習(xí)平臺(tái)以及維吾爾語(yǔ)大量詞匯,推出維吾爾語(yǔ)語(yǔ)音識(shí)別服務(wù),助力維漢之間商業(yè)文化的交流,推動(dòng)當(dāng)?shù)亟?jīng)濟(jì)社會(huì)全面發(fā)展。
標(biāo)貝維語(yǔ)語(yǔ)音識(shí)別能力
語(yǔ)音識(shí)別是解決讓機(jī)器聽(tīng)得懂的問(wèn)題,但是受復(fù)雜的外部因素影響,如環(huán)境噪聲、多人對(duì)話、方言口音等,都會(huì)對(duì)識(shí)別結(jié)果造成一定干擾,一旦識(shí)別錯(cuò)誤,就可能影響溝通雙方對(duì)信息的理解。
標(biāo)貝科技基于自研的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練聲學(xué)模型,并采用大量維語(yǔ)語(yǔ)料數(shù)據(jù)進(jìn)行模型和系統(tǒng)的迭代調(diào)優(yōu),最終輸出可以商業(yè)化的維語(yǔ)語(yǔ)音識(shí)別服務(wù)能力,整體識(shí)別速度和準(zhǔn)確率可以滿足多種語(yǔ)音交互場(chǎng)景的個(gè)性化需求。
例如,在智能客服領(lǐng)域,針對(duì)人工坐席與客戶的通話錄音進(jìn)行智能話務(wù)質(zhì)檢,幫助客服提升服務(wù)質(zhì)量;在政務(wù)應(yīng)用方面,可以為新疆地區(qū)公安、司法等機(jī)構(gòu)提供智能會(huì)議語(yǔ)音轉(zhuǎn)寫(xiě)方案,為法院提供智能庭審實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)系統(tǒng),讓信息溝通變得順暢,有效提升政法機(jī)構(gòu)業(yè)務(wù)效率;在線教育場(chǎng)景中,精準(zhǔn)識(shí)別維語(yǔ)學(xué)習(xí)者的口語(yǔ)發(fā)音、表達(dá)能力并進(jìn)行分析,快速提高口語(yǔ)能力。
標(biāo)貝維語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù)
眾所周知,基于機(jī)器學(xué)習(xí)的各種技術(shù),往往都離不開(kāi)算法和數(shù)據(jù)的積累。而想要提高語(yǔ)音識(shí)別的準(zhǔn)確率,就需要大量的優(yōu)質(zhì)語(yǔ)音數(shù)據(jù)作為模型訓(xùn)練支撐。
維吾爾語(yǔ)是新疆維吾爾自治區(qū)的官方語(yǔ)言之一,目前我國(guó)境內(nèi)使用人口約有1,500萬(wàn)。由于其黏著性語(yǔ)言的特征,利用豐富的詞綴可以產(chǎn)生超大詞匯,讓維吾爾語(yǔ)語(yǔ)音在采集、標(biāo)注上的難度高于國(guó)內(nèi)其他語(yǔ)言,導(dǎo)致維語(yǔ)的語(yǔ)音識(shí)別訓(xùn)練語(yǔ)料始終稀缺,給語(yǔ)音識(shí)別帶來(lái)很大困難。
面對(duì)以上難題,標(biāo)貝科技在上線維語(yǔ)語(yǔ)音識(shí)別服務(wù)前,就已經(jīng)推出800小時(shí)、1000多人參與錄音的成人維語(yǔ)朗讀及自由交談數(shù)據(jù)庫(kù),已經(jīng)完成標(biāo)注,數(shù)據(jù)質(zhì)量達(dá)到商業(yè)化的要求。
成人維吾爾語(yǔ)朗讀數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)特點(diǎn):朗讀類語(yǔ)音
錄音環(huán)境:安靜室內(nèi)
數(shù)據(jù)時(shí)長(zhǎng):600 h
錄音人數(shù):605人
錄音語(yǔ)料:通用
文件格式:WAV
語(yǔ)音參數(shù):16kHz/16bits
錄音設(shè)備:手機(jī)
適用領(lǐng)域:可應(yīng)用于智能客服、智能家居等語(yǔ)音識(shí)別場(chǎng)景
成人維語(yǔ)自由交談數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)特點(diǎn):自由交談?lì)愓Z(yǔ)音
錄音環(huán)境:安靜室內(nèi)
數(shù)據(jù)時(shí)長(zhǎng):200 h
錄音人數(shù):450人
錄音語(yǔ)料:通用
文件格式:WAV
語(yǔ)音參數(shù):16kHz/16bits
錄音設(shè)備:手機(jī)
適用領(lǐng)域:可應(yīng)用于智能會(huì)議系統(tǒng)、輸入法、社交等語(yǔ)音識(shí)別場(chǎng)景
歡迎對(duì)以上數(shù)據(jù)集感興趣的行業(yè)伙伴聯(lián)系我們~
伴隨此次維語(yǔ)語(yǔ)音識(shí)別能力的上線,當(dāng)前標(biāo)貝科技可以支持中文、英文、粵語(yǔ)、維語(yǔ)四種語(yǔ)言的語(yǔ)音識(shí)別,廣泛應(yīng)用于工作、生活、學(xué)習(xí)多種場(chǎng)景。未來(lái),標(biāo)貝科技將在技術(shù)創(chuàng)新和數(shù)據(jù)服務(wù)的基礎(chǔ)上,持續(xù)為AI產(chǎn)業(yè)打造更準(zhǔn)確、更高效的語(yǔ)音識(shí)別服務(wù)。