【ITBEAR】8月10日消息,OpenAI公司于近日發(fā)布了一份詳盡報告,揭示了GPT-4o模型的系統(tǒng)卡(System Card)內(nèi)容,其中包含了外部紅隊測試、準備框架(Preparedness framework)等多個關(guān)鍵細節(jié)。
報告指出,GPT-4o模型的核心在于其獨特的準備框架(Preparedness framework),這是一種系統(tǒng)性的方法,旨在評估并降低人工智能系統(tǒng)所帶來的風(fēng)險。據(jù)ITBEAR了解,該框架的應(yīng)用范圍廣泛,覆蓋了網(wǎng)絡(luò)安全、生物威脅、說服技巧以及模型自主性等多個領(lǐng)域,致力于識別這些領(lǐng)域內(nèi)可能存在的潛在危險。
除了對GPT-4和GPT-4V進行的安全評估和緩解措施外,OpenAI還針對GPT-4o的音頻功能加強了安全工作。這些評估涵蓋了揚聲器識別、未經(jīng)授權(quán)的語音生成、可能侵犯版權(quán)的內(nèi)容生成、無根據(jù)的推斷以及不允許的內(nèi)容等多個方面。基于這些細致的評估結(jié)果,OpenAI在模型和系統(tǒng)層面均實施了相應(yīng)的保障措施,以確保其音頻功能的穩(wěn)健性和安全性。
在模型發(fā)布之前,OpenAI還與100多名外部紅隊人員進行了緊密合作,共同對模型進行了全面的評估。這些紅隊人員負責進行探索性的能力發(fā)現(xiàn),評估模型可能帶來的新風(fēng)險,并對已實施的緩解措施進行了嚴格的壓力測試,以確保模型在實際應(yīng)用中的穩(wěn)定性和安全性。