10 月 20 日消息,世界上大約 7000 種已知的語言中,有 40% 沒有標(biāo)準(zhǔn)的書寫系統(tǒng)。這些沒有文字的語言給現(xiàn)代機(jī)器學(xué)習(xí)翻譯系統(tǒng)帶來了一個(gè)獨(dú)特的問題,因?yàn)榉g通常需要先將口頭語言轉(zhuǎn)換為書面文字,翻譯后再將文字還原為語音。不過 Meta 公司 10 月 19 日宣布,已經(jīng)通過其最新的開源語言人工智能(AI)解決了這個(gè)問題。
Meta 公司公布了“第一個(gè)由人工智能驅(qū)動(dòng)的無文字語言的語音翻譯系統(tǒng)”,該系統(tǒng)成功地翻譯了閩南語,這是一種主要在臺(tái)灣地區(qū)使用的口頭語言。
該系統(tǒng)是 Meta 公司人工智能項(xiàng)目的一部分,被稱為“通用語音翻譯器(UST)”。Meta 公司在一份聲明中說:“該翻譯系統(tǒng)是 Meta 人工智能的通用語音翻譯器項(xiàng)目的第一個(gè)里程碑,該項(xiàng)目專注于開發(fā)人工智能系統(tǒng),提供所有語言的實(shí)時(shí)語音到語音翻譯,甚至無文字語言。”該項(xiàng)目正致力于開發(fā)更多實(shí)時(shí)語音到語音的翻譯,以便元宇宙居民更方便地互動(dòng)。
Meta 說,以前大多數(shù)人工智能驅(qū)動(dòng)的語言翻譯工作都集中在書面語言上,但其目標(biāo)之一是翻譯更多缺乏正式書寫系統(tǒng)的語言。據(jù) Meta 公司稱,目前有 7000 多種語言,但“超過 40% 的語言主要是口語,沒有標(biāo)準(zhǔn)的或廣為人知的書寫系統(tǒng)。”
Meta CEO 馬克-扎克伯格在發(fā)布在 Facebook 上的視頻中演示了該用該系統(tǒng)翻譯閩南語,并表示 Meta 公司將對該工具進(jìn)行開源,以便人們可以使用新的人工智能系統(tǒng)來翻譯更多的語言。
來源:IT之家