5 月 23 日消息,Meta 公司推出了 Massively Multilingual Speech(MMS)項目,為 1100 多種語言提供了先進的語言轉文本、文本轉語音服務,且支持將近 4000 多種未標記的口語。
Meta 為 MMS 項目整合了自我監(jiān)督學習工作 wav2vec 2.0 和一個新的數(shù)據(jù)集,通過實測發(fā)現(xiàn) MMS 優(yōu)于現(xiàn)有模型,且支持的語言數(shù)量是其 10 倍。
Meta 創(chuàng)造這項成就的關鍵在于引入了龐大的音頻數(shù)據(jù)集,其中包含 1100 多種新約圣經(New Testament)的朗讀內容。Meta 表示整合該音頻數(shù)據(jù)集之后所產生的語音模型在男性和女性聲音中表現(xiàn)同樣出色。
【來源:IT之家】