
歷經三次審議修改的資料安全法終於在9月1日正式實施。作為資料安全領域的關鍵技術——隱私計算也迅速從小眾技術中脫穎而出,廣受業界關注。
什麼是隱私計算呢?2000年圖靈獎得主姚期智曾提出著名的“百萬富翁”設想:兩個百萬富翁在街上相遇,他們都想知道誰更富有,但又不願意讓對方知道自己擁有的真正財富。如何在沒有第三方參與的情況下,讓對方知道誰更有錢?
這個問題看上去無解,實際上,它反映了資料使用權與所有權之間的矛盾問題,而隱私計算似乎就是為解決這個矛盾而生的。

什麼是隱私計算?
以最為常見的網際網路資訊服務為例,多數網際網路平臺在提供服務的時候,既獲得了資料的使用權,也幾乎獲得了資料的實際所有權。使用者僅能保留對資料的名義所有權。在公眾對資料隱私安全焦慮加劇的今天,有沒有一種技術可以讓資料使用權與所有權分離,在保障使用者資料所有權的同時不影響網際網路平臺提供正常的資訊服務呢?答案就是隱私計算。
簡而言之,隱私計算就是透過使用加密處理、多方計算等方法來處理使用者隱私資料。資料使用方(例如網際網路平臺)得到的不再是使用者原始資料,而是加密後的資料。賽迪智庫網路安全研究所工程師張博卿對《中國電子報》記者說:“作為一種推動資料安全有序流動的解決方案,隱私計算的核心價值是能夠實現‘資料可用不可見’‘資料不動模型動’,具備打破資料孤島、加強隱私保護、強化資料安全合規性的能力。”

資料來源:《中國隱私計算產業發展報告(2020-2021)》
“隱私計算一定是涉及多方參與的場景(內部的資料使用不存在隱私問題),而多方參與的場景就必然會引入多方之間的信任問題。”微眾銀行區塊鏈隱私計算技術負責人李輝忠在接受《中國電子報》記者採訪時表示,“隱私計算體系共涉及三個關鍵技術支撐:區塊鏈、聯邦學習和安全多方計算。區塊鏈是一個比較好地解決多方互信問題的基礎技術,業界普遍認為隱私計算將會深度結合區塊鏈技術。而聯邦學習解決資料聯合建模問題,安全多方計算解決多方資料融合問題,這兩個技術都是隱私計算的基礎技術。”
需要注意的一點是,隱私計算可以在安全可控的前提下實現資料開放流通,但它並不是唯一解。張博卿強調說:“例如在資料安全合規性方面,也可以透過差分隱私、K-匿名、L-多樣性等模型實現資料匿名,進而滿足資料安全法、網路安全法的部分合規性要求,但這些技術在資料匿名的過程中削弱了資料蘊含的價值,隱私計算相對而言更好的平衡了資料安全和資料使用價值,在一些場景中更為適用。”
走出“黑盒化”誤區
事實上,中國的隱私計算研究從一開始就是和國際同步甚至是領先的。頂層設計方面,網路安全法、資料安全法、個人資訊保護法“三駕馬車”並行,倒逼企業在資料採集、使用、流通全環節中重視及投入資料保護,隱私計算行業也因此迎來重大利好。在這樣的背景下,以網際網路大廠、大資料公司、運營商、金融機構和金融科技企業、隱私計算初創企業為代表的五大類玩家相繼入局。騰訊、阿里巴巴、百度、位元組跳動、UCloud等大小玩家的身影皆在其中。翼方健數、螞蟻金服、微眾銀行、華控清交被視為隱私計算 “四小龍”,受到資本青睞。

國家工業資訊保安發展研究中心近期釋出的《中國隱私計算產業發展報告(2020-2021)》顯示,隱私計算產品市場規模約為 10 億元,基於隱私計算的資料交易應用模式市場或將達到千億級。據不完全統計, 2021年上半年,國內隱私計算領域新增融資金額已超過6億元,融資金額過億的企業更是超過了50%。在資料安全的新命題下,隱私計算終於迎來了期盼已久的商機。
然而,距離實現真正“破局”尚有一段距離。首先,市場對隱私計算的認知度、認可度仍然不足。這一方面是因為隱私計算技術複雜且常常呈現“黑盒化”現象,導致大部分使用者對隱私技術難以理解和信任;另一方面對技術理解得不夠全面,會使使用者對技術應用的效果產生過度預期。
對此,李輝忠坦言:“大家在對隱私計算的認知上需要升級,包括在法規層面、科普層面以及生態層面,需要有更多的人去積極地推動這件事情。區塊鏈剛開始也遇到類似的情況,隨著越來越多的人參與進來,整個業界對區塊鏈的認知已經有了很大的提升。隱私計算同樣也需要有更多的人去積極推動,做到認識和行動統一,打破隱私悖論。”
其次,隱私計算技術的安全性和效能有待進一步完善。張博卿表示:“例如聯邦學習技術中,各方貢獻的資料結構不一將導致模型訓練難,攻擊者可供給惡意構造的訓練集導致模型輸出錯誤結果。”
李輝忠認為,技術本身就會存在各種各樣的問題,比如效能問題、安全問題等。隱私計算在效能上、資料量上、產品體驗等方面都帶有複雜性,這會導致業界在提供解決方案時不得不做出一些妥協,“而這樣的妥協是否合理,也是需要時間逐步推進認知。”
UCloud優刻得大資料與隱私計算負責人馬強對《中國電子報》記者表示:“不管是沙箱、隱私計算,還是多方聯邦計算,或多或少都會有一些計算不夠完善的地方,比如隱私計算的效能比較弱,能夠實現的場景比較少;沙箱計算,需要把資料彙總在一起;聯邦計算,只能夠針對人工智慧來做等等。總體來看,技術上的挑戰是比較大的。”
最令人擔憂的地方是不同隱私計算平臺有可能形成新的資料孤島,這與隱私計算實現資料安全共享流動的初衷相悖,也將直接影響隱私計算的發展前景。李輝忠表示,從平臺技術選型角度看,目前主流路線包括安全多方計算(MPC)、聯邦學習(FL)和區塊鏈。一方面,每個技術路線仍存在安全性、效能、易用性等多方面問題;另一方面,不同的技術各有所長,有各自較為適宜的應用場景。“眼下想要讓所有隱私計算平臺互聯互通起來,存在一定的挑戰。”
對此,翼方健數CEO羅震提出了資料和計算網際網路概念。他認為,可以讓原始的資料孤島透過私有的隱私計算協議連線起來,形成更大的島鏈的同時,不同島鏈又可以透過通用的隱私計算方式連線起來,最終形成資料和計算網際網路。而李輝忠認為:“關於隱私計算平臺互聯互通可以開始關注和探討,但不必急功近利,不妨‘讓子彈再飛一會兒’。隱私計算的技術和應用更成熟之後,在供需側才能夠快速推動互通的落地。”
此外,馬強指出:“如何對資料進行確權,如何進行估值,如何能夠確保資料在法律的安全性,這是資料的確權和估值上、價值評估上是一個比較大的挑戰。”他認為,要把這個事情真正做起來,需要良好的生態環境。目前隱私計算賽道上的參與者還在摸索自身定位,暫時沒法形成一個比較良好的產業生態。
整體來看,儘管隱私計算在金融、醫療、智慧城市等場景已展現出普遍的需求場景,但目前鑑於法規完善、技術信任等方面不夠充分,還沒有看到非常亮眼的、標杆性的應用落地。李輝忠說:“我覺得隱私計算的發展還需要一點時間的,需要依賴於逐步完善的法規制度、逐步最佳化的技術和產品體驗、以及對於隱私計算的信任。”
未來之路該怎麼走?
根據國際知名研究機構Gartner預測,到2025年,50%的大型企業機構將採用隱私計算來處理不可信環境或多方資料分析用例中的資料。業界普遍認為,這個領域還有很大的想象空間。那麼,接下來,隱私計算的路究竟該怎麼走?
馬強認為,資料流通是一個新興的產業,它的發展模式可以參考其他領域,引入更多的合作方,打造一個開放的平臺。以證券交易為例,上交所的上下游產業比較多,比如有律師事務所,有專門負責上市的券商,有購買證券的股民,還有各種監管機構。資料交易也可以參考這樣的模式。
他談到:“資料提供方要把資料進行流通,必須要有券商的機構,確保資料所有權是確權的,有律師機構做合理的審查工作。經過了類似上交所或者是證監會的認定之後,可以進行掛牌交易,掛牌可以分為場內交易和場外交易,這個時候可以提供一個場內的交易平臺或者是場外的資料流通平臺,後面是有演算法提供方和監管方和資料的使用方。”
另外,馬強還分享了一個有意思的場景是數字海關,即針對有跨境流通需求的資料,可以使用類似安全屋這樣的隱私計算解決方案,在資料本身不出境的情況下,有限定地輸出計算結果,為資料安全流通監管提供技術支援。這樣既能開放資料流通又能確保資料的安全。“未來資料交易平臺不僅面向國內,還可以面向全球。”
究竟什麼樣的參與者有機會領跑賽道?李輝忠認為:“既要能夠從技術層面普及和推廣,也要能夠在應用角度探索落地合作,最重要的是,還能透過開源生態更好地建立技術信任。”
“未來,隱私計算的應用將帶動密碼產業、人工智慧產業細分領域的發展。隨著資料安全法、個人資訊保護法、網路安全法及其配套法規體系的日臻完善,隱私計算在合規性上的作用將受到重視,其應用也將帶動整個網路安全產業的發展。”張博卿談到。
延伸閱讀:
作者丨宋婧
編輯丨連曉東
美編丨馬利亞
