在近期于上海舉辦的2025世界人工智能大會(huì)期間,一場聚焦于多語言大模型技術(shù)的國際學(xué)術(shù)研討會(huì)吸引了廣泛關(guān)注。此次研討會(huì)由科大訊飛主辦,其研究院院長劉聰在會(huì)上分享了關(guān)于科大訊飛最新研發(fā)的星火大模型X1的重要進(jìn)展。
據(jù)劉聰介紹,星火大模型X1在語言能力上取得了顯著突破,現(xiàn)已支持超過130種語言,且在阿拉伯語、德語、法語、韓語、日語等關(guān)鍵語種上的表現(xiàn)已超越GPT-4.1。在語音識(shí)別領(lǐng)域,通過混合語種路由等創(chuàng)新技術(shù),星火語音大模型實(shí)現(xiàn)了對100種語言的精準(zhǔn)識(shí)別,其性能超過了Whisper V3。星火語音合成大模型也展現(xiàn)出了強(qiáng)大的多語種合成能力,覆蓋55種語言。
劉聰進(jìn)一步闡述了科大訊飛星火多語種大模型的未來研發(fā)藍(lán)圖。他指出,未來的研發(fā)將聚焦于三大核心方向:首先是推動(dòng)“語音+文本”多模態(tài)數(shù)據(jù)的深度整合與共享,以打破不同模態(tài)間的語義隔閡;其次是構(gòu)建具備原生多語種語音處理能力的大模型基礎(chǔ)架構(gòu),提升模型對全球語言環(huán)境的敏銳感知;最后是開發(fā)具備跨語言知識(shí)遷移能力的通用大模型,以實(shí)現(xiàn)不同語種間知識(shí)的有效傳遞與泛化能力的提升,為全球多語言AI應(yīng)用的發(fā)展提供堅(jiān)實(shí)支撐。
此次研討會(huì)匯聚了來自亞洲、歐洲近20個(gè)國家和地區(qū)的約30位人工智能領(lǐng)域的專家學(xué)者、產(chǎn)業(yè)界代表及研究人員。劉聰在會(huì)上表示:“科大訊飛致力于構(gòu)建全面覆蓋的多語言大模型及其應(yīng)用體系,旨在為全球用戶提供除現(xiàn)有主流選項(xiàng)之外的另一種強(qiáng)大選擇。”
與會(huì)者普遍認(rèn)為,科大訊飛星火大模型的最新進(jìn)展不僅展示了中國在人工智能領(lǐng)域的創(chuàng)新實(shí)力,也為全球多語言AI技術(shù)的發(fā)展注入了新的活力。