【ITBEAR科技資訊】9月11日消息,螞蟻集團今日宣布推出一項創新性的大模型安全解決方案,命名為“蟻天鑒”。這一方案旨在應對大模型在生產和使用過程中的安全挑戰,包括AIGC安全性和真實性評估、智能風險防控、以及AI魯棒性和可解釋性檢測等多項關鍵功能。這是迄今為止首個針對大型AI模型的產業級應用安全檢測與防御一體化解決方案。蟻天鑒包括兩大核心產品:大模型安全檢測平臺“蟻鑒2.0”和大模型風險防御平臺“天鑒”,而這兩款產品已對外開放。
螞蟻集團的工作人員指出,大模型在安全方面面臨三大主要問題源,包括“用于訓練的數據源頭有毒、推理過程不可控、外部惡意誘導”。為解決這些問題,蟻天鑒聚焦于大模型安全性檢測度量、智能風險防控、以及數據清洗等領域,以確保大型AI模型在生產和使用中更加安全、可控和可靠。
根據ITBEAR科技資訊了解,其中的“蟻鑒2.0”是首個支持文本、圖像等多種數據類型的產業級AI安全檢測平臺。它通過智能攻擊對抗技術,模擬黑客攻擊的方式,生成大量誘導性問題,然后對大型AI模型的回答進行實時自動化檢測,以識別潛在的弱點和安全問題。此外,“蟻鑒2.0”還具備了對AIGC生成的圖片、視頻等多模內容進行“真偽”辨別和安全性檢測的能力,可快速區分內容是否由機器生成,以及是否存在倫理和道德風險。
另一方面,“天鑒”則扮演著外部惡意攻擊的防護盾角色,借助智能風險控制技術,保護大模型免受外界惡意提問的侵害,并過濾生成的回答內容,確保整個過程安全可靠。據了解,“天鑒”平臺不僅可以在用戶輸入階段快速理解意圖和風險,還能以不同的風險控制方式來應對,同時也能夠迅速提升大模型的風險認知和防御能力,同時保障用戶體驗,確保輸出內容合規且健康。
總之,螞蟻集團的“蟻天鑒”為大型AI模型的安全性帶來了全新的解決方案,通過綜合考慮安全檢測、智能風險防御和數據清洗等關鍵環節,為大型AI模型的應用提供了更可靠的保護。