聽說新疆又上熱搜了。
當(dāng)然,這次還是因為傳說中神秘的“喀納斯水怪”。
雖然最后景區(qū)工作人員回應(yīng)了水中黑影是哲羅鮭,否認(rèn)了“水怪”的說法。但是并不妨礙人們對于神秘、美麗的新疆喀納斯的向往。
近年來,隨著“一帶一路”發(fā)展戰(zhàn)略的推進(jìn),擁有極其豐富資源的新疆作為“絲綢之路經(jīng)濟(jì)帶”核心地區(qū),已經(jīng)成為我國西部地區(qū)經(jīng)濟(jì)增長重要支點(diǎn),與其他民族之間的交融與日俱增,越來越多的人開始了解新疆。
新疆作為我國少數(shù)民族自治區(qū),近50%的人口是維吾爾族,以維吾爾語為其主要使用語言,其中有很大一部分人不懂得漢語。
隨著AI的飛速發(fā)展,應(yīng)用場景不斷擴(kuò)展,智能語音設(shè)備無處不在,對于方言語音識別的需求也在日漸增加。為了讓維吾爾族民眾也能夠享受人工智能、大數(shù)據(jù)、云計算等新技術(shù)為工作生活所帶來的便利,標(biāo)貝科技基于深度學(xué)習(xí)平臺以及維吾爾語大量詞匯,推出維吾爾語語音識別服務(wù),助力維漢之間商業(yè)文化的交流,推動當(dāng)?shù)亟?jīng)濟(jì)社會全面發(fā)展。
標(biāo)貝維語語音識別能力
語音識別是解決讓機(jī)器聽得懂的問題,但是受復(fù)雜的外部因素影響,如環(huán)境噪聲、多人對話、方言口音等,都會對識別結(jié)果造成一定干擾,一旦識別錯誤,就可能影響溝通雙方對信息的理解。
標(biāo)貝科技基于自研的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練聲學(xué)模型,并采用大量維語語料數(shù)據(jù)進(jìn)行模型和系統(tǒng)的迭代調(diào)優(yōu),最終輸出可以商業(yè)化的維語語音識別服務(wù)能力,整體識別速度和準(zhǔn)確率可以滿足多種語音交互場景的個性化需求。
例如,在智能客服領(lǐng)域,針對人工坐席與客戶的通話錄音進(jìn)行智能話務(wù)質(zhì)檢,幫助客服提升服務(wù)質(zhì)量;在政務(wù)應(yīng)用方面,可以為新疆地區(qū)公安、司法等機(jī)構(gòu)提供智能會議語音轉(zhuǎn)寫方案,為法院提供智能庭審實時語音轉(zhuǎn)寫系統(tǒng),讓信息溝通變得順暢,有效提升政法機(jī)構(gòu)業(yè)務(wù)效率;在線教育場景中,精準(zhǔn)識別維語學(xué)習(xí)者的口語發(fā)音、表達(dá)能力并進(jìn)行分析,快速提高口語能力。
標(biāo)貝維語語音數(shù)據(jù)庫
眾所周知,基于機(jī)器學(xué)習(xí)的各種技術(shù),往往都離不開算法和數(shù)據(jù)的積累。而想要提高語音識別的準(zhǔn)確率,就需要大量的優(yōu)質(zhì)語音數(shù)據(jù)作為模型訓(xùn)練支撐。
維吾爾語是新疆維吾爾自治區(qū)的官方語言之一,目前我國境內(nèi)使用人口約有1,500萬。由于其黏著性語言的特征,利用豐富的詞綴可以產(chǎn)生超大詞匯,讓維吾爾語語音在采集、標(biāo)注上的難度高于國內(nèi)其他語言,導(dǎo)致維語的語音識別訓(xùn)練語料始終稀缺,給語音識別帶來很大困難。
面對以上難題,標(biāo)貝科技在上線維語語音識別服務(wù)前,就已經(jīng)推出800小時、1000多人參與錄音的成人維語朗讀及自由交談數(shù)據(jù)庫,已經(jīng)完成標(biāo)注,數(shù)據(jù)質(zhì)量達(dá)到商業(yè)化的要求。
成人維吾爾語朗讀數(shù)據(jù)庫
數(shù)據(jù)庫特點(diǎn):朗讀類語音
錄音環(huán)境:安靜室內(nèi)
數(shù)據(jù)時長:600 h
錄音人數(shù):605人
錄音語料:通用
文件格式:WAV
語音參數(shù):16kHz/16bits
錄音設(shè)備:手機(jī)
適用領(lǐng)域:可應(yīng)用于智能客服、智能家居等語音識別場景
成人維語自由交談數(shù)據(jù)庫
數(shù)據(jù)庫特點(diǎn):自由交談類語音
錄音環(huán)境:安靜室內(nèi)
數(shù)據(jù)時長:200 h
錄音人數(shù):450人
錄音語料:通用
文件格式:WAV
語音參數(shù):16kHz/16bits
錄音設(shè)備:手機(jī)
適用領(lǐng)域:可應(yīng)用于智能會議系統(tǒng)、輸入法、社交等語音識別場景
歡迎對以上數(shù)據(jù)集感興趣的行業(yè)伙伴聯(lián)系我們~
伴隨此次維語語音識別能力的上線,當(dāng)前標(biāo)貝科技可以支持中文、英文、粵語、維語四種語言的語音識別,廣泛應(yīng)用于工作、生活、學(xué)習(xí)多種場景。未來,標(biāo)貝科技將在技術(shù)創(chuàng)新和數(shù)據(jù)服務(wù)的基礎(chǔ)上,持續(xù)為AI產(chǎn)業(yè)打造更準(zhǔn)確、更高效的語音識別服務(wù)。