隱私計算 讓資料成為資訊時代的生產要素

2021-10-06 06:46:01 字數 2729 閱讀 7420

arpa聯合創始人 & ceo felix xu撰文,5分鐘帶你了解安全多方計算mpc原理與企業應用。

本文同時首發於京東區塊鏈、鏈聞、csdn。

以下為正文部分:

針對資料共享面臨的問題,筆者認為隱私計算技術可為業界提供新思路,賦能資料確權並實現資料」可用但不可見」。設想參與資料分析的各方,互相看不到資料,但是可以共同做分析甚至訓練模型,將最終結果傳送給資料付費方,即可杜絕資料洩漏的風險。目前安全多方計算、聯邦學習等隱私計算技術逐步走向成熟,在涉及使用者隱私資料的金融、醫療、政務等領域中,讓機構間的資料合作成為可能。而隱私計算與區塊鏈技術的結合,既能保證輸入資料可信,亦可隱藏運算過程,可謂魚和熊掌兼得。本文中筆者將簡單介紹安全多方計算的原理,並拋磚引玉介紹潛在應用。

安全多方計算(secure multi-party computation, mpc)技術,亦稱安全計算(secure computation)和隱私保護計算(privacy-preserving computation)。安全多方計算是當今密碼學的乙個重要分支,是繼成熟解決資料加密儲存、傳輸之後的重要嘗試,在密文資料上直接構建運算。具體而言,安全多方計算由 n 個互相不信任的參與方進行,聯合對乙個協商確定的函式進行計算,能夠保證參與方的隱私輸入資料 x1,x2,···,xn 無法被其他參與方獲得。姚期智院士(andrew c.yao)於1982 年發表的文章「 protocols for secure computation」首次提出姚氏百萬富翁問題和安全多方計算的概念。這個有趣的問題是,兩個百萬富翁希望知道誰更富有,但是不希望對方或第三方知道自己的財富值。之後 goldreich,micali 和 widgerson 等密碼學家將這個問題一般化成為現在的安全多方計算問題。此後該領域內學術研究和商業應用蓬勃發展,如今安全多方計算協議是多種密碼協議的組合,如同態加密、零知識證明、秘密分享等。近10年來,密碼學界對安全多方計算的探索有了長足的發展,筆者在實踐中發現一些特定協議的計算效率已經達到商用程度。與區塊鏈類似,安全多方計算同樣存在「不可能三角」,需要在安全性,通用性,計算效率這三點之間權衡。工業界,包括筆者所在的公司arpa,根據不同場景優化協議使之滿足商業需求。

當今使用的安全多方計算技術按底層技術分為兩個分支,基於混淆電路(garbled circuit)的與基於秘密分享(secret sharing)。混淆電路與不經意傳輸(oblivious transfer)為姚期智院士提出的安全計算技術路徑。簡單來講,基於混淆電路的協議更適用於兩方邏輯運算,通訊輪數固定,但是拓展性稍差。另一類基於秘密分享的安全多方計算中,資料輸入和計算中間值都會以「密文分片」的方式存在。秘密分享技術可以把隱私資料切割為2份或更多份後,將隨機分片分發給計算參與方,這個過程保護了資料隱私又允許多方聯合對資料進行計算。之後,就可以利用分片間存在的同態計算性質來實現在分片上計算並重建得到隱私資料計算結果。基於秘密分享的安全多方計算目前主要由歐洲密碼學界主導,如smart, damgard等密碼學家,其拓展性較強,理論上支援無限多方參與計算,計算效率高,但通訊負載較大。

黑名單主要用於記錄個人或企業客戶的不良行為。每個機構都會維護多種業務的黑名單,從小型商業公司到跨國機構,從金融交易到信用記錄。機構之間的黑名單共享和查詢有助於幫助機構規避風險,如多頭借貸、多頭騙保等,然而對於黑名單的明文共享既危害使用者隱私也洩露商業機密。利用隱私計算進行的黑名單查詢可以在保護隱私的情況下降低機構風險。這類計算需要對比兩組列表並找出其中重合的部分,這個過程應能保證參與方無法獲得除結果外的資訊,並可以規避被查詢方獲得查詢條件。

轉化率計算這類資料共享問題即「隱私交集問題」。兩家公司分別持有自己業務範圍內活躍使用者資料集,一方擁有與第乙個活動相關的使用者列表,例如在網際網路上檢視廣告的使用者,另一方擁有在第二個活動中進行過交易的使用者列表,例如購買過廣告商品的使用者,以及與每個使用者關聯的數值(比如該使用者的支出)。其中一方希望了解他們共有的使用者數量以及相關數值的總和,而並不希望分享更多的資料。例如,廣告主希望知道「三十歲一下的男性消費總和是多少」,可以通過隱私計算在不共享資料和查詢條件的情況下獲得交集,計算轉化率等指標。

目前信貸風控需要通過多個資料來源採集資料,進行決策樹、邏輯回歸、隨機森林等運算。從2023年下半年開始,國家對非法採集販賣個人隱私資料的大資料公司進行了整頓,原始資料愈加難以獲得。隱私計算可以合規的鏈結同業和異業公司,組成資料聯盟,在各方輸入資料不洩露前提下進行分布式模型推斷或者訓練,有效降低多頭信貸、欺詐等風險。同時風控模型的引數在計算中亦不會暴露,保護了模型提供方的智財權。

arpa 致力於為企業與個人提供基於加密運算和區塊鏈的隱私資料安全流轉解決方案。

arpa 安全多方計算網路可以作為協議層為公鏈實現隱私計算能力,並賦能開發人員在私密智慧型合約上構建高效、安全、能保護資料隱私的的商業應用。企業和個人資料可以在arpa 計算網路上被安全分析或利用,而不必擔心將資料暴露給任何第三方。arpa多方計算技術支援安全資料市場,精準營銷,信用評分計算,甚至個人資料的安全變現。

arpa的核心團隊高度國際化,有來自清華大學的密碼學博士,來自谷歌,優步,亞馬遜,華為和三菱的經驗豐富的系統工程師,東京大學的區塊鏈專家,以及來自aig,世界銀行,circleup的資料科學家,還有來自復星和富達投資的金融、資料方面的專業人士。

洩露隱私資料,就該讓CEO坐牢

洩露隱私資料,ceo 該去坐牢。就問你支援不支援?今天,這則美國參議員提案讓 炸了鍋。不少聚集在 hacker news 跟帖討論。有支援重刑以治隱私資料洩露亂象,也有認為類似方案標準難定無法施行,更有觀點覺得對大公司沒x用 人有強大的法律團隊 所以只會限制中小創業公司創新。不過,既然已有這樣的聲音...

1688調整訂單隱私資料操作 資訊將脫敏展示

程式設計客棧 wwwbazgzgt.cppcns.com 8月4日 訊息 不得不說,當下網購消費者個人資訊被洩露的現象比較嚴重,為了更好保護消費者資料,1688平台宣布調整訂單隱私資料操作。1688平台稱,為了進一步保護買家訂單程式設計客棧隱私資料,1688平台自2021年8月10日起將對商家中心訂...

安全架構之Https 讓你的隱私資料不再暴露

一.常見的加密方式 對稱加密和非對稱加密 二.對稱加密演算法 特點 加密和解密的金鑰相同 問題 網路是不安全的,如何實現金鑰的安全傳輸?三.非對稱加密演算法 特點 傳送方和接收方各持有一對鑰匙 公鑰 和私鑰 用公鑰 私鑰 加密的資料只有對用的私鑰 公鑰 才能解密。四.非對稱加密 對稱加密 1 傳送方...