中國信通院開啟大模型幻覺測試，涵蓋人文社科等五大維度-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：52011
待審：79
小程序：12
文章：1184964
會員：801

中國信通院開啟大模型幻覺測試，涵蓋人文社科等五大維度

發布時間：2025-03-19 16:50:35 作者：網友整理

近日，中國信息通信研究院（中國信通院）通過其官方微信公眾號發布了一項重要舉措，旨在深入探索大型人工智能模型（大模型）的“幻覺”現象，并推動其在實際應用中的安全與可靠性。該舉措基于前期AI Safety Benchmark的測評經驗，正式啟動了針對大模型的幻覺測試項目。

所謂大模型幻覺（AI Hallucination），是指當這些模型在生成文本或回答問題時，可能會創造出看似合理但實際上與用戶輸入不符（即忠實性幻覺）或違背事實（即事實性幻覺）的內容。隨著大模型在醫療、金融等關鍵行業的廣泛應用，這種幻覺現象所帶來的潛在風險日益凸顯，引起了業界的廣泛關注。

本次幻覺測試主要針對的是大語言模型，測試內容涵蓋了忠實性幻覺和事實性幻覺兩大類型。為了全面評估這些模型，測試數據包含了超過7000條中文測試樣本，測試形式則分為信息抽取、知識推理（針對忠實性幻覺）以及事實判別（針對事實性幻覺）等題型。測試維度廣泛，涵蓋了人文科學、社會科學、自然科學、應用科學和形式科學等多個領域。