在當(dāng)今飛速發(fā)展的數(shù)字時(shí)代,生成式大模型正以其令人矚目的創(chuàng)意能力和潛力引領(lǐng)著人工智能領(lǐng)域的前沿。
作為一種集合了復(fù)雜算法、海量數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的產(chǎn)物,生成式大模型已經(jīng)廣泛應(yīng)用于自然語(yǔ)言處理、創(chuàng)意生成、智能對(duì)話等領(lǐng)域。然而,盡管其在創(chuàng)造性和創(chuàng)新性方面取得了巨大成功,但也不可避免地面臨著一些潛在風(fēng)險(xiǎn)和挑戰(zhàn)。
為了迎接大模型帶來(lái)的數(shù)字化變革,工程中心基于《生成式人工智能服務(wù)管理暫行辦法》推出了大模型評(píng)測(cè)維服務(wù)。
一、生成式大模型 風(fēng)險(xiǎn)與挑戰(zhàn)
隨著生成式大模型的廣泛應(yīng)用,一些問(wèn)題也開(kāi)始浮現(xiàn)。其中包括信息可信度的問(wèn)題,模型可能會(huì)誤導(dǎo)用戶或產(chǎn)生不準(zhǔn)確的內(nèi)容;另外,隱私和數(shù)據(jù)安全也成為了關(guān)切的焦點(diǎn),模型可能會(huì)泄露敏感信息。因此,在探索生成式大模型的無(wú)限潛力的同時(shí),科學(xué)評(píng)測(cè)其風(fēng)險(xiǎn)勢(shì)在必行。
1、數(shù)據(jù)安全與合規(guī)風(fēng)險(xiǎn)問(wèn)題
數(shù)據(jù)樣本的隱私性、知識(shí)產(chǎn)權(quán)、數(shù)據(jù)質(zhì)量可能無(wú)法得到有效保護(hù),從而導(dǎo)致生成式人工智能輸出內(nèi)容異常;
惡意用戶可能利用系統(tǒng)漏洞,運(yùn)用特定手段導(dǎo)致模型數(shù)據(jù)泄露, 以及一些不良信息的輸出;
2、對(duì)話與輸出機(jī)制——用戶風(fēng)險(xiǎn)與價(jià)值風(fēng)險(xiǎn)
模型可能因?yàn)闊o(wú)法審核帶有誘導(dǎo)性的指令, 或無(wú)法判斷生成結(jié)果的影響, 導(dǎo)致輸出不良信息;
生成的內(nèi)容可能包含錯(cuò)誤、不準(zhǔn)確或無(wú)法驗(yàn)證的信息, 模型可能在處理特定問(wèn)題時(shí)在邏輯上缺乏一致性和連貫性;
3、政策導(dǎo)向——國(guó)內(nèi)監(jiān)管日趨加強(qiáng)
(1)2023年4月中共中央政治局召開(kāi)會(huì)議,分析研究當(dāng)前經(jīng)濟(jì)形勢(shì)和經(jīng)濟(jì)工作。會(huì)議提出要重視通用人工智能發(fā)展,營(yíng)造創(chuàng)新生態(tài),重視防范風(fēng)險(xiǎn)。
(2)2023年5月,北京市人民政府辦公廳印發(fā)了《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》,加強(qiáng)了大模型等通用人工智能的評(píng)測(cè)監(jiān)管。
其中,第九條強(qiáng)調(diào):“建設(shè)大模型評(píng)測(cè)開(kāi)放服務(wù)平臺(tái),建立公平高效的自適應(yīng)評(píng)測(cè)體系,根據(jù)不同目標(biāo)和任務(wù),實(shí)現(xiàn)大模型自動(dòng)適配評(píng)測(cè)。”
(3)2023年7月七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》,自2023年8月15日起施行。
《辦法》明確生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開(kāi)展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng),使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型;涉及知識(shí)產(chǎn)權(quán)的,不得侵害他人依法享有的知識(shí)產(chǎn)權(quán);涉及個(gè)人信息的,應(yīng)當(dāng)取得個(gè)人同意或者符合法律、行政法規(guī)規(guī)定的其他情形;采取有效措施提高訓(xùn)練數(shù)據(jù)質(zhì)量,增強(qiáng)訓(xùn)練數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、客觀性、多樣性。此外,明確了數(shù)據(jù)標(biāo)注的相關(guān)要求。
二、工程中心生成式大模型評(píng)測(cè)服務(wù)
為了迎接大模型帶來(lái)的數(shù)字化變革,工程中心基于《生成式人工智能服務(wù)管理暫行辦法》制定了全新的評(píng)測(cè)維度,形成大模型評(píng)測(cè)服務(wù),為模型的全面性能評(píng)估提供了更多的視角,可有效提升大模型服務(wù)的透明度,提高生成內(nèi)容的準(zhǔn)確性和可靠性。
工程中心大模型評(píng)測(cè)服務(wù)從穩(wěn)定性、交互性、應(yīng)用性、安全性、魯棒性五大評(píng)測(cè)維度等多角度出發(fā),針對(duì)生成式人工智能模型目前存在問(wèn)題,進(jìn)行全方位評(píng)測(cè),不僅涵蓋當(dāng)前主流評(píng)測(cè)體系的評(píng)測(cè)維度,還引入了一些新的維度來(lái)評(píng)估模型的性能和合規(guī)性。
• 模型穩(wěn)定性評(píng)測(cè)
模型穩(wěn)定性測(cè)評(píng)是評(píng)估模型在非常規(guī)輸入下能否提供安全穩(wěn)定的服務(wù),用于測(cè)試大模型在各種場(chǎng)景下的穩(wěn)定性和性能。這有助于評(píng)估模型在實(shí)際應(yīng)用中是否能夠滿足需求。
• 模型交互性和應(yīng)用性評(píng)測(cè)
具體包括了多語(yǔ)種評(píng)測(cè)、語(yǔ)言流暢度、情感分析、代碼評(píng)測(cè)、專業(yè)翻譯、摘要能力、百科知識(shí)、邏輯推理等多個(gè)子項(xiàng)。通過(guò)這些評(píng)測(cè)子項(xiàng),可以全方位衡量大模型的表現(xiàn)和能力。
• 模型安全性評(píng)測(cè)
模型安全性主要包含模型可以避免虛假、歧視信息輸出、數(shù)據(jù)合規(guī)檢查以及環(huán)境安全檢測(cè)等多個(gè)子項(xiàng),為模型可靠性和安全性提供應(yīng)用依據(jù)。
工程中心大模型評(píng)測(cè)服務(wù)以法律層面《個(gè)人信息保護(hù)法》、《網(wǎng)絡(luò)安全法》、《中華人民共和國(guó)數(shù)據(jù)安全法》、《中華人民共和國(guó)密碼法》等法律要求;國(guó)家標(biāo)準(zhǔn)層面《GB_T 22239-2019信息安全技術(shù) 網(wǎng)絡(luò)安全等級(jí)保護(hù)基本要求》、《GB-T 39412-2020 信息安全技術(shù) 代碼安全審計(jì)規(guī)范》、《GB_T 25000.10-2016 系統(tǒng)與軟件工程 系統(tǒng)與軟件質(zhì)量要求和評(píng)價(jià)(SQuaRE) 第10部分系統(tǒng)與軟件質(zhì)量模型》、《GB_T 41479-2022 信息安全技術(shù) 網(wǎng)絡(luò)數(shù)據(jù)處理安全要求》、《GM/T 0054-2018信息安全技術(shù) 信息系統(tǒng)密碼應(yīng)用基本要求》、《GB/T 20984-2022信息安全技術(shù) 信息安全風(fēng)險(xiǎn)評(píng)估方法》等標(biāo)準(zhǔn);為支撐實(shí)現(xiàn)大模型軟件安全、等級(jí)保護(hù)、密碼評(píng)估、風(fēng)險(xiǎn)評(píng)估、代碼審計(jì)、數(shù)據(jù)安全等合規(guī)性的評(píng)測(cè)。
• 模型魯棒性評(píng)測(cè)
模型魯棒性主要包含模型可以抵御惡意數(shù)據(jù)的輸入、防止隱私泄露以及模型輸出的可解釋性,從測(cè)試數(shù)據(jù)攻擊、訓(xùn)練數(shù)據(jù)投毒、隱私泄露以及可解釋性多角度出發(fā)進(jìn)行評(píng)測(cè)。
了解更多服務(wù)詳情可通過(guò)工程中心官方微信【信息安全國(guó)家工程研究中心】聯(lián)系交流。
讓我們共同創(chuàng)造一個(gè)安全、可靠的人工智能未來(lái)!