2021年以來,我國陸續發布《“十四五”國家信息化發展規劃》、《“十四五”數字經濟發展規劃》等重要國家數據戰略,強調建設數字中國,加快數據要素市場化流通,創新數據要素開發利用機制。
價值的流通是數據要素流通的本意與核心,而制度與技術是激活數據要素的“路與橋”。以技術搭建互聯互通數據價值網絡,保障數據安全與隱私,實現“數據可用不可見,數據不動價值動”。以頂層設計健全數據產權、交易流通、收益分配、安全治理等數據基礎制度體系,構建多維立體數據價值流通體系,是數據要素市場化建設的關鍵“題眼”。
9月3日,由世界人工智能大會組委會辦公室指導,粵港澳大灣區大數據研究院、開放群島開源社區、智能投研技術聯盟(ITL)、FATE開源社區聯合主辦的2022世界人工智能大會-數據要素流通技術前沿探索論壇上,30余位學術界、產業界、科研及行研機構專家學者與行業領袖齊聚一堂,聚焦數據要素市場培育、基礎制度建設,關鍵技術創新,交流和探討了數據要素流通的前沿動態與創新成果。
逢山開路,完善數據要素市場化基礎制度
數據交易流通的重要性毋庸置疑,但卻面臨重重困難。各領域機構數據交易業務正處于“蹣跚前行”,乃至停滯狀態。原因在于數據要素在資源化、資產化進程中,缺乏數據要素流通基礎制度。數據要素共享、流通、交易仍處于小范圍、小規模階段,導致數據要素市場供給不足、流通不暢、應用不深。
國家信息中心原常務副主任、粵港澳大灣區大數據研究院名譽理事長杜平致辭中,針對激活數據要素價值,提出三方面建議。一是注重數據要素產權、供給、流通、監管等多方面基礎制度的深化改革,促進數據要素市場化配置。二是建設集約高效的“根服務+公共服務+算力服務”三大數據交易基礎設施,建立數據要素技術服務、交易服務和算力跨云、跨域調度體系。三是加快數字化技術研發及成果轉化進程。探索元宇宙生態及其商業應用場景,拓展新的數據資源生成空間和數據要素資產化證券化空間。
國家信息中心大數據發展部規劃處處長、粵港澳大灣區大數據研究院院長王建冬認為,數據要素市場化配置改革應探索形成以數據要素基礎支撐體系為底座的多層級、立體化的數據交易市場體系和數據交易服務生態體系。可從加強數據要素基礎設施和標準規范建設、強化公共數據共享開放和新技術應用、發揮政府引導作用促成產業集聚優勢、創新完善監管體制機制和信用體系建設以及積極開展數據跨境流通試點示范工程等多方面著力構建全國統一的數據要素市場體系。
中國信通院云大所所長何寶宏表示,數據產權劃分、保護、交易流通的滯后引發“數據孤島”“數據壟斷”等現象,為數據要素流通產生阻礙。他認為,培育數據要素市場的核心思路在于健全數據市場規則,厘清數據產權,確定數據價值評估方式,強化隱私計算等關鍵技術創新,實現數據要素的“殊途同歸”。
遇水架橋,發揮隱私計算、可信數據空間等數據流通核心技術作用
專家一致認為完善數據要素市場化配置機制體制,將進一步推動行業發展,定位我國數據要素市場未來走向。而如何通過數字技術創新,在保障原始數據“可用不可見”前提下,安全可信開展數據流通與融合應用,保證跨行業、跨機構的數據使用合規、范圍可控,確保數據所有權不因流通與共享而發生讓渡,也是當下推動數據要素流通普及、普惠的重要議題。
近年來,快速發展起來的可信聯邦學習、多方安全計算等隱私計算技術與可信數據空間正在成為數據價值分享體系的關鍵技術底座,產業應用實踐日益成熟。
中國人工智能學會(CAAI)榮譽副理事長、加拿大工程院院士、加拿大皇家科學院院士楊強表示,可信聯邦學習的安全可證明,模型性能可使用,決策可監督,模型可監管以及普惠等特性,為培育高質量的數據要素市場提供基礎性技術支撐。然而,想要使數據要素流通更通暢、更安全,開源開放必不可少。
“我認為,開源是數據要素流通產業發展的一條重要’中軸線’,建設并發展開源社區,讓更多角色參與數據流通技術生態,是實現技術普及的必要前提之一。”楊強表示,全球首個隱私計算和聯邦學習開源社區 —— FATE正不斷完善,目前已有 4000 多位個人工程師與開發者,以及 800 多家企業機構參與社區共建。
自2019年FATE社區發布首個開源項目以來,極大加速了國內聯邦學習環境及參與方從單兵作戰走向生態化。未來,社區將進一步推進并服務于跨平臺的互聯互通,以及安全機制的建立,從而支持數據確權、定價、模型交易,支持數據交易所和跨境數據交易。
華為公司數據總架構師馬運也表示,考慮到數據要素易復制、難確權、難定價、非排他性等特性。數據想要成為生產要素流通,需從數據清潔、共享與可控交換著手,讓數據與貨幣一樣在流動中不斷增值。
華為從2014年便開始探索與構建真正可讓數據放心流動的治理體系與IT平臺。目前,華為已構建了企業數據底座,以“管入、管存、管出、管用”的平臺能力實現企業內數據的高效共享與敏捷自助,同時構建了EDS企業數據空間,以“可信、可控、可證”平臺能力實現企業間數據的可控交換與價值釋放。
技術底座之外,數據流通另一個重要的問題在于安全與性能的平衡。諸多數據要素流通技術為最大程度保障數據安全與隱私,引入了大量密碼學運算,這使得計算量幾何級增加。以全同態技術為例,在通用芯片上密文運算的速度比明文運算慢了10萬倍,是導致隱私計算等技術一直未得到廣泛應用的根本原因。
香港科技大學教授、智能網絡與系統實驗室主任、星云Clustar創始人陳凱表示,安全、效率、效果的平衡與統一,是數據要素流通技術走向規模化應用的關鍵。“以算法與協議創新,算力硬件加速,網絡優化加速等軟硬件結合技術手段,在保障數據隱私安全與數據建模效果的前提下,提升計算效率是很重要的破局點。”陳凱稱,目前實驗室與星云Clustar合作分別從這三方面不斷提升算力性能:
算法優化方面,提出了一種基于隨機掩碼的奇異值分解方案。該方案的效率比同態加密提高 10000 倍,誤差比差分隱私方案小 10 個數量級,同時提供了安全性分析和實驗驗證。
硬件加速方面,針對隱私計算應用場景中數據建模、推理、對齊的12種常用密碼學算子與2個核心算子,進行了硬件加速,通過FPGA算力加速卡實現端到端30倍以上性能提升。
網絡優化方面,通過數據中心內部網絡傳輸與廣域網數據傳輸的分別優化,實現高帶寬、低延時的數據密態傳輸。
“讓隱私計算技術為數據價值更高效的應用與挖掘,驅動業務創新服務,為應用方創造增益價值是隱私計算廣泛應用的重要因素之一。我們希望未來數據的交易、流通能夠在保證足夠安全的前提下,實現與明文計算類似的效率。”陳凱總結道。
在圓桌討論環節,來自中國信通院、粵港澳大灣區大數據研究院、中國銀聯、中國移動、華為、百度、成飛集團、FATE開源社區、比特飛揚、數鑫科技的多位專家學者與企業代表,分別圍繞“互聯互通激活數據要素流通生態”、“ 可信數據空間助力數據要素流通”話題展開討論,并從自身業務與實踐角度出發,闡述數據流通技術與數據要素市場的緊密關系。一致認為,為實現激活數據要素潛能,培育數據要素市場,革新數據要素分配機制,架橋鋪路,實現數據有序、安全、合規流通將是必然途徑。