近年《刑法》和《網絡安全法》逐步增加了對個人隱私信息保護的規定。同時,我國即將立法出臺《個人信息保護法》進一步完善對個人隱私安全與數據安全的保護細節。關于隱私安全計算也有相關的行業規定標準:國標和通標。尤其是通標,有專門針對隱私安全的相關標準“T/BDC 001-2019 基于安全多方計算的數據流通與產品技術要求與測試方法”。
2020年1月10日,數牘科技CTO蔡超超受邀參加2019年中國大數據技術與應用年會,作為大數據前沿技術代表發言。蔡超超認為隨著國家及個人對數據保護與隱私安全重視程度的提升,在相關法律法規初步出臺和細化的今天,隱私計算作為更新式的數據流通、協作方法,可以幫助企業按照國家認可的合規方式進行數據流通與協作。而且在工程落地方面也已經完成了一些常見場景的案例落地,完全可以投入到實際的生產應用中去。
數據為什么要流通?-數據天然的割裂性
首先,不同公司和企業會根據其業務需求收集不同種類的數據(例如:網購數據、健康安全數據 、社交數據等)同一個個體不同維度的數據分別被不同的公司收集和存儲著,這就形成了數據維度的割裂。另一種是樣本上的割裂,例如北京的醫院主要擁有北京及周邊地區用戶的健康數據,而上海的醫院則擁有上海及周邊地區用戶的健康數據,這就形成了一個地域或樣本上的天然分隔。
這些數據的分隔,會在數據挖掘和人工智能建設過程中出現一些困難,如缺少樣本或缺少相關的特征函數,阻礙了 AI 的發展。而數據的流通性,可以很好的彌補這一塊的缺失,數據的流通與協作能讓 AI 發揮更好的作用。
但隨著人們對數據安全及個人隱私的重視程度逐漸提高,相關法律法規的出臺和落地,也給數據流通協作帶來一些挑戰。傳統的方法暴露出一些缺點,比如不能有效的保護個人隱私,也無法完全保護核心數據的不泄露。這些促使更新式的數據流通與協作方法的出現 ,例如隱私計算。
隱私計算為原來不能融合的數據提供了機會,讓我們能夠拼接更多數據以挖掘更新的信息出來,從而促進整個社會智能發展, 所以說隱私計算會逐漸成為AI的基礎設施。
什么是隱私計算?
隱私計算是一門交叉學科,它是數據科學與工程、密碼學、分布式計算與存儲的綜合工程,而不是單一的密碼學。它涉及到多樣技術,包括:差分隱私,多方計算 MPC,聯邦學習,TEE等。
在當今的技術環境中,隱私計算現在技術上最大的挑戰是工程落地:如何把隱私計算做到高效計算,并且能功落地是現在碰到最大的挑戰。隱私計算貫穿數據流通的整個過程,與數據和計算天然相關,設計者對數據和場景的理解也很重要,只有對數據科學和工程實踐都有豐富的經驗積累才能設計出真正工程可用的產品。
我們剛才介紹了隱私計算的多種方法,那么它是如何真正的保護數據,又能幫助企業間做交叉數據挖掘的呢?
多方安全計算