“哪里不會點哪里,媽媽再也不擔心我的學習了,so easy!”
當年這段廣告詞可謂洗腦神句傳遍大江南北,點讀機作為教育場景的典型電子產(chǎn)品,也一度風靡市場。
隨著AI技術在教育場景的廣泛應用,特別是語音交互技術豐富了學生上課體驗形式。以點讀機、學習機、甚至AI虛擬老師等為代表的教學方式也越來越普及。讓在線教育更加智能化、個性化,有效解決了學生們差異化的學習需求。
目前,語音合成已經(jīng)進入較為成熟的發(fā)展階段,在教學內容生產(chǎn)方面,可以增加配課、點讀等有聲教學素材,甚至可以取代部分真人對話的教育內容,大大降低教學配音的成本和周期。
例如,在語文、英語等語言學習科目中,AI虛擬老師可以通過教學視頻和語音合成,生成虛擬教學內容,緩解線下教師的工作壓力;學生則借助智能學習設備,掃描自己想要學習的文字或短語,聽取正確的發(fā)音和語調,跟著模仿發(fā)音。
但是在數(shù)理化等科目里涉及到公式的讀法時,大部分語音合成軟件存在一定的難度。對于較為簡單的,如數(shù)學中的加減乘除、開方、指數(shù)、三角函數(shù)等,一般語音合成軟件通常可以給出正確的讀法。而對于復雜的如物理、化學等領域的公式,由于這些公式中可能包含大量的特殊符號、單位和上下文信息等,需要逐字進行轉換,耗費時間且準確率較低。
為了完善AI教育應用場景,標貝科技通過語音合成前端語言模型優(yōu)化,實現(xiàn)了語音合成技術對Latex數(shù)理化公式朗讀的支持,提供更好的教學體驗。
什么是Latex?
LaTeX是一種基于TeX的排版系統(tǒng),由美國計算機科學家萊斯利·蘭伯特在20世紀80年代初期開發(fā)。 MathJax是一個跨瀏覽器的JavaScript庫,它使用MathML、LaTeX和ASCIIMathML標記在Web瀏覽器中顯示數(shù)學符號。
舉例↓:
latex公式:
實際頁面展示的公式:
標貝科技基于LaTeX公式的基本組成單元和語法規(guī)則,依托精確的詞法分析和深入的句法分析技術,將復雜的LaTeX公式拆解為最細粒度的詞法單元,然后將這些單元映射為能準確反映LaTeX公式層次結構的抽象語法樹(AST)。
接著再建立一套規(guī)則,用于將LaTeX公式中的符號、元素和命令翻譯成自然語言。通過在AST上進行遍歷并應用這些翻譯規(guī)則,最終成功實現(xiàn)從LaTeX公式到自然語言的轉換。
目前,標貝科技語音合成技術能夠以通俗易懂的方式朗讀 LaTeX 公式,覆蓋從小學到初中12年教科書中涉及到的數(shù)學、物理、化學公式。同時標貝科技還可以根據(jù)客戶具體需求,定制高中及其他復雜數(shù)據(jù)符號的科目。
標貝科技前端語言模型優(yōu)化定制方案
在語音合成技術中,前端語言模型主要負責對輸入到語音合成系統(tǒng)的文本進行分析,并提取發(fā)聲和韻律特征,以便聲學模型根據(jù)這些特征生成對應的語音信號,是處理和生成語音信號的重要環(huán)節(jié)之一。
前端語言模型通常有一些通用方案,但是在不同的業(yè)務任務和數(shù)據(jù)特點下,通用方案無法直接將文本轉化為可合成的語音信號時,就需要對前端語言模型進行改進和優(yōu)化。
標貝科技可以提供前端語言模型優(yōu)化定制方案,將文本中復雜的數(shù)字、符號、縮寫等轉換成語言文字,客戶無需做二次轉換,即可獲得準確的發(fā)音,提高模型的性能和效果。
例如,除了支持以上LaTeX 公式類的朗讀外,標貝科技還可以通過前端語言模型優(yōu)化定制方案,輸出對手機型號或者各類機器設備型號的正確讀法。歡迎新老用戶咨詢體驗!