近期,網(wǎng)易有道在翻譯技術(shù)領(lǐng)域取得了顯著進(jìn)展,其自主研發(fā)的子曰翻譯大模型2.0已經(jīng)完成了底層技術(shù)的迭代升級(jí)。這一消息由鈦媒體APP從網(wǎng)易有道處獨(dú)家獲得。
據(jù)悉,此次升級(jí)的核心在于推出了14B小參數(shù)垂類模型,該模型在翻譯性能上達(dá)到了高水平,并已全面上線。這一模型的推出,意味著AI翻譯在訓(xùn)練和推理過程中所需的計(jì)算資源大幅減少,部署成本更低,更易于集成到現(xiàn)有的系統(tǒng)和設(shè)備中,從而適用于更多的實(shí)際應(yīng)用場(chǎng)景。
鈦媒體APP注意到,網(wǎng)易有道已將這一全新大模型應(yīng)用于其翻譯產(chǎn)品中,包括有道詞典、有道翻譯及有道翻譯官。用戶在使用這些產(chǎn)品時(shí),可以選擇標(biāo)準(zhǔn)模型或高級(jí)模型,滿足不同場(chǎng)景下的翻譯需求。同時(shí),網(wǎng)易有道旗下的智能硬件產(chǎn)品,如有道詞典筆X7系列,也已升級(jí)為最新的翻譯大模型,其他型號(hào)也將陸續(xù)進(jìn)行更新。
網(wǎng)易有道之所以能夠?qū)崿F(xiàn)這一技術(shù)突破,得益于其在數(shù)據(jù)、算法和評(píng)估三個(gè)層面的深入優(yōu)化。在數(shù)據(jù)層面,新的模型技術(shù)收集并清洗了大量高質(zhì)量的翻譯語(yǔ)料數(shù)據(jù),并由英語(yǔ)專業(yè)八級(jí)認(rèn)證人員及職業(yè)譯員進(jìn)行精細(xì)化標(biāo)注,確保了數(shù)據(jù)的優(yōu)質(zhì)性和多樣性。在算法層面,網(wǎng)易有道以子曰大模型為基礎(chǔ),進(jìn)行了二次預(yù)訓(xùn)練,并結(jié)合多種技術(shù)手段,如大模型蒸餾技術(shù)、大模型融合技術(shù)和Online DPO技術(shù)等,提升了翻譯性能。
網(wǎng)易有道還研發(fā)了翻譯評(píng)估模型Reward Model,為子曰翻譯大模型的性能評(píng)估提供了可靠的量化依據(jù)。這一評(píng)估模型結(jié)合人工評(píng)估方案,從多個(gè)維度對(duì)翻譯結(jié)果進(jìn)行評(píng)估和分析,確保了翻譯質(zhì)量的穩(wěn)定性和專業(yè)性。
子曰翻譯大模型2.0在中英文互譯領(lǐng)域取得了顯著突破,譯文的專業(yè)度和穩(wěn)定性較之前版本有了大幅提升。同時(shí),根據(jù)網(wǎng)易有道內(nèi)部測(cè)評(píng),新的翻譯模型在人文學(xué)科、商科、生活服務(wù)、醫(yī)療、科學(xué)等19個(gè)垂直領(lǐng)域的翻譯準(zhǔn)確率和流暢度也均有所提升。
網(wǎng)易有道相關(guān)負(fù)責(zé)人表示:“在通用大模型競(jìng)逐參數(shù)規(guī)模的背景下,我們更相信垂類模型的未來價(jià)值。通過專業(yè)的垂直應(yīng)用,我們可以真正解決專業(yè)場(chǎng)景的痛點(diǎn),這也是我們持續(xù)努力的方向。”這一觀點(diǎn)體現(xiàn)了網(wǎng)易有道在翻譯技術(shù)領(lǐng)域的深刻洞察和堅(jiān)定信念。
在大模型技術(shù)浪潮之前,網(wǎng)易有道的翻譯技術(shù)主要基于統(tǒng)計(jì)機(jī)器翻譯及神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)(NMT)。然而,隨著技術(shù)的不斷進(jìn)步和迭代,網(wǎng)易有道已經(jīng)成功轉(zhuǎn)型為以自主研發(fā)的大模型為核心競(jìng)爭(zhēng)力的翻譯技術(shù)提供商。
截至目前,網(wǎng)易有道詞典的月活躍用戶數(shù)已超過1億,自2019年起,已連續(xù)六年位居教育類工具領(lǐng)域榜首。這一成績(jī)不僅彰顯了網(wǎng)易有道在翻譯技術(shù)領(lǐng)域的領(lǐng)先地位,也為其未來的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。