【ITBEAR】8月10日消息,OpenAI公司于近日發布了一份詳盡報告,揭示了GPT-4o模型的系統卡(System Card)內容,其中包含了外部紅隊測試、準備框架(Preparedness framework)等多個關鍵細節。
報告指出,GPT-4o模型的核心在于其獨特的準備框架(Preparedness framework),這是一種系統性的方法,旨在評估并降低人工智能系統所帶來的風險。據ITBEAR了解,該框架的應用范圍廣泛,覆蓋了網絡安全、生物威脅、說服技巧以及模型自主性等多個領域,致力于識別這些領域內可能存在的潛在危險。
除了對GPT-4和GPT-4V進行的安全評估和緩解措施外,OpenAI還針對GPT-4o的音頻功能加強了安全工作。這些評估涵蓋了揚聲器識別、未經授權的語音生成、可能侵犯版權的內容生成、無根據的推斷以及不允許的內容等多個方面。基于這些細致的評估結果,OpenAI在模型和系統層面均實施了相應的保障措施,以確保其音頻功能的穩健性和安全性。
在模型發布之前,OpenAI還與100多名外部紅隊人員進行了緊密合作,共同對模型進行了全面的評估。這些紅隊人員負責進行探索性的能力發現,評估模型可能帶來的新風險,并對已實施的緩解措施進行了嚴格的壓力測試,以確保模型在實際應用中的穩定性和安全性。