0
| 本文作者: 李揚霞 | 2021-12-23 10:48 | 專題:GAIR 2021 |
【雷峰網】2021年12月9日-2021年12月11日,2021第六屆全球人工智能大會(GAIR 2021)于深圳開幕。本屆大會由粵港澳大灣區人工智能與機器人聯合會、雷峰網聯合主辦,深圳市人工智能與機器人研究院、深圳市機器人協會、深圳市人工智能學會支持。
作為中國最具影響力和前瞻性的前沿科技活動之一, GAIR 大會已經度過了五次精彩而又輝煌的歷程,見證數次潮水的轉向,成為目前為止粵港澳大灣區人工智能領域規模最大、規格最高的學術、工業和投資領域跨界盛會。
大會第二天,以《直面數據安全風險和挑戰;挖掘隱私計算的100%可為》為主題的“數據安全與隱私計算”分論壇吸引了來自全國各地的專家、學者、企業家、投資人等,大家齊聚一堂共話新時代下“數據安全與隱私計算”的當下與未來。
其中瑞萊智慧RealAI首席架構師徐世真帶來了題為「隱私計算助力構建AI新基建」的精彩演講。演講要點可概括為以下幾個方面:
AI和隱私計算息息相關,隱私計算是AI能力的重要補充,AI是隱私計算的核心需求。從場景角度來看,隱私計算通常和AI緊密相關,AI可以看成隱私計算的上層應用與核心技術。
隱私計算面臨的困境主要有生態壁壘、安全性、可用性、計算性能。
借鑒AI發展模式,隱私計算的技術路徑可走底層編譯路線實現兼容互通,通過優化底層密碼庫優化性能;產業路徑需要逐場景落地,并根據不同的場景選擇不同的技術路線。
徐世真認為只有深度結合AI,使業務方從隱私計算中獲益,才能把隱私計算從成本項變成營收項,保證企業有可持續的意愿度,保證數據價值閉環操作。
隱私計算僅僅是企業合規建設的一環,需要在法律法規的框架下進行。

瑞萊智慧RealAI首席架構師徐世真
以下是徐世真演講全文,雷峰網(公眾號:雷峰網)做了不改變原意的整理與編輯:
我是來自瑞萊智慧的徐世真,今天我的演講主題是《隱私計算助力構建AI新基建》。
瑞萊智慧是孵化自清華大學人工智能研究院的AI 企業,專注于人工智能領域的安全問題。隨著人工智能被納入新基建的范疇,安全可控成為一項核心的基礎能力,其中包括數據安全、算法可靠、應用可控。今天我主要分享一下公司在數據安全、隱私計算方面的研究。
一、隱私計算與AI能力互為補充
我們認為,AI和隱私計算是息息相關的。
首先,隱私計算是AI能力的重要補充。從技術角度看,足夠規模且多樣化的數據,才能訓練出比較好的模型,隱私計算能夠解決數據的“鏈接”問題,為算法的持續進化提供數據補充;
第二,AI是隱私計算的核心需求。從場景角度來看,隱私計算通常和AI緊密相關,AI可以看成隱私計算的上層應用與核心技術。基于密碼學原理的MPC/聯邦學習,需要針對特定應用進行程序改寫,而且多數是屬于AI應用,比如DNN、邏輯回歸或樹模型。從這一點來看,AI和隱私計算有一定的相通之處,他們都沒有一個通用技術方案解決所有問題。
第三,隱私計算是AI平臺的2.0版本。從產品角度來看,用戶需要的是帶有隱私計算功能的機器學習平臺。市場上主流的隱私計算平臺,其實提供的大多是AI建模能力,不過底層通過密碼學、MPC技術進行了隱私保護的功能。
總體來看,我們認為人工智能和隱私計算互為補充,且互為核心需求。
二、隱私計算的困境在哪里?
但目前我們也了解到,隱私計算面臨很多問題。
第一,生態壁壘。隱私計算解決數據孤島的問題,但解決了之后,反而會誕生技術孤島的問題,各家隱私計算的技術互不相通,也無法互相連接,基本意味著上層的代碼需要重構。
第二,計算性能。速度慢,因為引入了很多密碼學操作,要么是MPC帶來的通信問題,要么是同態加密帶來的計算性能問題,很難支撐大規模數據訓練,如果是億級或十億級的訓練,單純用聯邦學習或者MPC很難實現。
第三,安全性。各家從知識產權的角度不太會公開自己的底層協議(除了一些開源項目),這就帶來協議不透明的問題,難以審計。安全性如果沒辦法審計,將會蘊含巨大漏洞。
第四,可用性。我們為了做數據生態、解決方案生態,不可能要求客戶自己連接數據,所以作為一家隱私計算技術的服務商,我們需要提供開箱即用的數據,甚至需要提供開箱即用的解決方案,讓用戶能夠在不改變原來中心化非隱私計算操作體驗的情況下來使用隱私計算平臺。
三、AI發展趨勢為隱私計算的未來發展提供借鑒
剛剛聊到AI和隱私計算之間的關系,其實我們可以用AI的發展趨勢預測隱私計算將來的發展趨勢。
第一,AI為隱私計算解決兼容互通問題提供了借鑒。AI也有很多框架,比如Tensorflow、PyTorch,各個框架之間也很難互通,但后來出現了ONNX,在數據流圖層把各家的協議集中匯聚起來,再轉移成另一個框架可以執行的東西。數據流圖層面的兼容,是AI發展為解決框架之間互聯互通問題提出的方案,對隱私計算的互聯互通具有借鑒意義。
第二,AI為隱私計算性能優化提供了方向。我們知道AI也是吃算力的,AI的性能優化基本沿著兩條路線,一是硬件升級,最早是CPU,后來又有GPU,再到現在專用的AI芯片;二是算法升級,包括模型的壓縮、蒸餾、剪枝,把大模型變成小模型,這些對于隱私計算的發展也是適用的。
第三,AI為隱私計算解決安全性問題提供了路徑。我們做了一個技術實驗,一張雪山的圖片,經過添加對抗噪聲,可以讓AI識別錯誤,讓其識別成一張狗的圖片,這是AI的安全性問題。隱私計算也面臨類似的問題,比如通過橫向聯邦中的數據投毒、模型污染化,所以AI和隱私計算在安全性提升方面面臨的問題也是相通的。
第四,AI為隱私計算場景落地問題提供了借鑒。前幾年一直說AI賦能萬物,AI賦能所有產業,現在大家發現是產業結合AI、場景結合AI。隱私計算目前也處在這兩種思想的匯聚期,到底是隱私計算作為底座賦能所有產業,還是結合具體場景來選擇相應的隱私計算技術?這是兩種路線之爭。當然,我們相信結合場景的AI更有價值,結合場景的隱私計算也更實際、更可落地、更有價值。
從AI的發展經驗來推演隱私計算的發展,在技術路徑方面,概括來說有以下幾個思路:
第一,編譯器路線。兼容互通應該在底層算子層完成,不應該只停留在軟件層或集成層,底層數據流圖也是安全、可追溯、可驗證的工具,可表達計算邏輯。第二,性能優化。短期可以通過優化底層的密碼庫來實現,未來還需要新硬件的介入,更好地提升速度。第三,隱私計算的安全性,包含抵御密碼協議層和應用層的惡意攻擊,隨著AI的發展,一些對抗樣本攻擊的問題開始出現,隱私計算的發展將來也將面臨一些新安全問題,我們應該在當前發展的時候就考慮到,而不是先發展后治理。
四、隱私計算的產業路徑需要逐場景落地
同樣參考AI發展模式,我們認為隱私計算的產業路徑需要逐場景落地,并根據不同的場景選擇不同的技術路線。借用信通院講的三大技術路線來闡述多方安全計算、聯邦學習和可信執行環境各個路線之間的優劣勢。
(1)從應用場景來說,MPC更適合數值類簡單計算和查詢求交類特定計算;聯邦學習主要是針對機器學習的場景,計算邏輯比較復雜,不是簡單計算;TEE更適合通用計算場景,比如有時候想跑一個完整的Tensorflow或數據庫應用,用前兩個比較難,用這個比較合適。
(2)從技術優勢的角度來說,簡單的分布式統計/查詢求交場景下,MPC比較成熟,但復雜計算情況下受限于通信情況,還是不太成熟;聯邦學習,保證數據不出庫的情況下進行復雜的機器學習、建模,大部分情況下的計算性能還是尚可的,但是在一些特別大量的數據下,密碼學計算還是主要的限制;TEE是集中式的數據處理,易開發,它的算法/框架生態是最好的。
(3)從技術劣勢的角度來說,MPC的通信量大,支持簡單的計算邏輯可行,但計算邏輯一旦復雜,就耗費一定時間,比如一個Resnet,2-party,一張圖片的inference可能需要10分鐘以上,在實際落地中是完全不可接受的;聯邦學習主要是面向AI建模場景,但有的場景就是想簡單的求和、求最大值,這時候聯邦學習就不是理想方案;TEE主要劣勢是依賴于硬件廠商的硬件可信性,和用戶是否接受數據集中式處理。
目前隱私計算這一賽道比較火熱,但是還有很多問題沒有解決。比如隱私計算解決的是數據流通安全性的問題,分離了數據所有權和使用權,避免流通過程中的資產損失,但它沒辦法解決端到端的安全問題。很多企業更希望獲得的是端到端安全保障,比如數據存儲、數據采集怎么做,以及數據流通前后的權屬該怎么定,隱私計算在解決這樣的全鏈路安全問題上,還面臨著一系列挑戰。所以,隱私計算僅僅是企業合規建設中的一個技術環節,整體上還是需要在法律法規的指導下進行。
還有數據流通的意愿問題,如果企業只是把隱私計算當成企業合規建設的成本項,那數據交易也很難推行下去。徐世真認為,只有深度結合AI,使業務方從隱私計算中獲益,才能把隱私計算從成本項變成營收項,保證企業有可持續的意愿度,保證數據價值閉環操作。
五、編譯級隱私計算平臺RealSecure,打通落地“最短鏈路”
據了解,瑞萊智慧推出的隱私計算平臺RealSecure是業內首個編譯級隱私計算平臺,自主研發聯邦AI編譯器,實現以數據流圖變換的形式實現機器學習算法到聯邦機器學習算法的自動轉換,無需針對每個參與方編寫特定的計算邏輯,適配多種機器學習算法。數據流圖的形式可直觀展示加密過程,底層執行的計算公開可審計,深度結合密碼學證明,支持完整證明聯邦算法協議的安全性。
同時,該平臺創新性的引入了全同態加密技術,將密碼設計中的批次處理和機器學習中以Tensor為最小數據單元的場景相結合,在部分機器學習算法中,該平臺相對于主流開源框架有40倍以上端到端的速度提升。
基于RealSecure平臺,瑞萊智慧推出了“平臺+數據+服務+場景”的一體化解決方案,基于這套方案實現多個場景案例。
比如某家頭部銀行的資產躍遷分析案例。該銀行希望統計集團子公司中交集客戶總資產,定位發生資產躍遷客戶,獲取高凈值客戶名單,并分析資產躍遷潛在原因及差異化潛在高凈值客戶的營銷策略。但是各個子公司不愿意透漏各自的數據詳情、全過程各個參與方不能獲取或者泄露各自數據詳情。通過與瑞萊智慧合作,銀行、保險子公司、證券子公司分別部署隱私保護計算平臺(RealSecure)節點,基于RSC的PSI(隱私求交)及MPC(多方安全計算加法)技術,在保護各方數據隱私的前提下,統計集團子公司的交集客戶總資產,并定位交集客戶中的資產躍遷,獲取高凈值客戶名單,根據統計結果制定差異化高凈值客戶營銷策略。
最后,瑞萊智慧也與中倫律師事務所合作開展企業合規體系建設。雙方基于優勢互補,充分發揮資源優勢,在數字經濟時代針對人工智能、數據交換等新場景下監管機構的合規要求,對內健全技術合規體系建設,對外面向企業輸出應用合規咨詢服務。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。