在近期于中關村論壇系列活動框架內舉辦的第12屆數字金融與科技金融大會上,螞蟻數科憑借其在Deepfake檢測技術上的突破,成功吸引了業界的廣泛關注。其Deepfake檢測方案被大會評選為“金融科技技術創新與應用案例”,標志著螞蟻數科在這一領域的領先地位。
螞蟻數科通過旗下的天璣實驗室,首次在金融行業內構建了一個大規模、高質量且包含多種模態的Deepfake數據集。該數據集合成了超過百萬級的多媒體內容,全面模擬了金融風控環境中可能遭遇的Deepfake攻擊,為評估現有金融領域Deepfake檢測模型的性能提供了重要基準。在實際金融業務場景中,螞蟻數科的Deepfake檢測方案在多個測試數據集上均達到了98%以上的準確率,有效阻止了多起利用Deepfake技術進行的欺詐行為,有力保障了用戶的財產安全。
這一數據集的推出,解決了金融領域Deepfake檢測模型長期以來面臨的大規模訓練及真實環境測評難題。同時,從多模態分析的角度出發,該數據集也推動了傳統檢測模型的進一步發展。目前,該數據集已成為螞蟻數科反深偽產品ZOLOZ Deeper對外服務客戶的核心競爭力。
螞蟻數科在構建這一數據集時,采用了多達81種先進的Deepfake技術,生成了高質量的合成圖像。這些圖像涵蓋了多種偽造技術類型、復雜光照條件、背景環境和面部表情,從而能夠模擬出復雜且逼真的真實世界攻擊環境。除了靜態圖像外,螞蟻數科還收集并生成了大量包含聲音的視頻數據,涵蓋了100多種偽造技術類型,并考慮了不同語種、口音和背景噪音的多樣性,進一步確保了數據集的全面性和復雜性。
在數據預處理和標注階段,螞蟻數科對收集到的數據進行了嚴格的清洗和預處理,確保了數據的高質量。同時,螞蟻數科還組建了專家團隊對數據進行標注,明確了每張圖像或每個視頻是否為Deepfake生成的內容,并盡可能減少了偽造痕跡,以達到高度逼真的效果。螞蟻數科此前發布的AI數據合成與生產平臺,在數據標注層面實現了“AI主導”,顯著降低了人工標注的工作量,標注模型依賴人工標注量降低了70%以上。
為了進一步驗證和評估Deepfake數據集的有效性,螞蟻數科在2024外灘大會上發起了一場Deepfake攻防挑戰賽。該比賽以Deepfake數據集為基礎訓練和測試數據,吸引了來自全球26個國家和地區的2200多名選手報名參賽。通過選手們貢獻的算法方案,Deepfake數據集的攻擊質量和檢測難度得到了全面而有效的驗證。
隨著人工智能技術的快速發展,Deepfake技術也在不斷進步。該技術利用深度學習算法,能夠實現對視頻中人臉的逼真替換。盡管Deepfake在娛樂和傳媒等領域有著廣泛的應用前景,但在金融領域,特別是身份驗證和交易驗證環節,Deepfake技術卻帶來了新的安全挑戰。金融機構的身份驗證系統通常依賴于生物識別技術,如人臉識別。一旦這些系統被Deepfake技術所攻破,將可能引發嚴重的金融欺詐事件。因此,開發針對Deepfake攻擊的檢測系統,對于金融領域來說具有至關重要的意義。
然而,構建強大的Deepfake檢測防御模型,需要高質量且符合真實世界環境的人臉Deepfake數據集。因此,如何構建模擬真實世界的數據集,以及如何驗證其有效性,成為了當前亟待解決的問題。螞蟻數科在這一領域的突破,無疑為金融行業的Deepfake檢測技術發展提供了新的思路和方向。