廈門大學的一支科研團隊近日在古文字研究領域邁出了創新步伐,他們宣布正探索利用人工智能(AI)技術,特別是多模態大模型,來輔助破解歷史悠久的甲骨文。這一消息通過該校官方公眾號于12月4日正式發布。
甲骨文,亦被稱為“殷墟文字”,是擁有超過三千年歷史的古老文字體系,被視為世界四大古文字之一,同時也是現代漢字的源頭。然而,傳統的甲骨文考釋工作極為復雜且耗時,主要依賴專家通過字形分析、辭例研究等人工方法進行釋讀,這不僅要求深厚的專業知識,還需廣泛閱讀大量相關文獻。
面對甲骨文考釋工作的巨大挑戰,廈門大學的研究團隊轉而尋求AI技術的支持。近年來,AI技術的飛速發展,特別是深度學習模型在語義表示方面的強大能力,為甲骨文的輔助考釋提供了新的可能。
針對甲骨文數據稀缺且圖像質量參差不齊的問題,該團隊系統整理了相關古文字數據,構建了更大規模、更高質量的甲骨文多模態數據集。他們提出了“基于甲骨文多模態大模型的多元信息輔助考釋模型”的技術方案,旨在通過AI技術提高考釋效率和準確性。
為了有效訓練這一多模態大模型,團隊設計了一系列與實際考釋過程密切相關的任務和評估方法。這些方法包括跨字體圖像映射、跨字體IDS(表達結構的部首偏旁序列)解碼以及甲骨字與現代漢字的對譯關系等,旨在全方位提升模型的考釋能力。
團隊充分利用AI的跨模態理解能力,將音、形、義、用等多元信息融入考釋過程中。在大模型提供的語義嵌入基礎上,他們還設計了一個端到端的甲骨文綜合考釋模型,該模型結合了字形結構分析、語義關聯判斷、同音通假識別以及用法聚類分析等多種方法。他們還致力于開發一種更加輕量的考釋系統,以適應資源有限的實際考釋場景。
通過這一創新性的研究方法,廈門大學的研究團隊為甲骨文的考釋工作開辟了新的道路。他們相信,隨著AI技術的不斷進步和應用,將有更多古老的文字被重新解讀,為人類文明的研究和發展貢獻新的力量。