資料脫敏系統的功能點

2021-10-06 14:16:39 字數 1444 閱讀 6965

伴隨著資料的流動,往往意味著資料從高安全環境遷移到低安全環境,甚至是非安全環境,而資料脫敏則是保證流通資料安全最有效的方法。

從資料流動的場景來看,目前主要有兩大類:一是為開發、測試、培訓等提供脫敏後的生產資料,二是為資料交易、資料交換、資料分析等第三方資料應用場景提供適用的資料。

目前,資料脫敏需求仍主要集中在第一種場景,即開發、測試等環境下的資料安全。下面,我們主要針對這種場景進行分析,一款好的資料脫敏產品要如何實現敏感資料安全管理?

1 如何保證資料一致性

該場景對於脫敏後資料與業務的一致性有嚴格要求,特別是供開發及測試環境使用。一旦出現資料與業務不匹配,會導致業務系統無法正常執行或者影響最終結果。

保證資料與業務的一致性,主要通過以下幾種手段進行保障:

保持資料的原始特徵

資料的原始特徵是指,可對資料進行識別的特徵,包括資料型別、內容定義、校驗演算法等,如(身份證是乙個數字串,前6位為地區碼,中間8位為出生年月,後3位為順序碼,最後一位為校驗碼)。脫敏系統會自動根據資料的特徵模型進行處理,從而保證特徵不做變化。

保持資料間的關聯性

資料的關聯性是指,資料庫表設計決定了資料之間存在依賴性,如實體資料與字典資料之間的關聯、實體資料與交易資料之間的關聯等。這種關聯性需要從演算法上進行保障,通過「固定對映」演算法,可實現相同原始資料經過脫敏處理後結果相同。

保持資料間的一致性

資料的一致性是指,資料之間存在邏輯關聯關係,比如資料的層級關係、資料的對應關係等,如使用者身份證資訊和使用者的出生年月之間就存在明顯的一致性。這種一致性的保障,需要通過系統提供的複雜脫敏規則一致性脫敏進行實現。

同步資料庫物件

資料庫物件往往承載了使用者的業務處理過程,如常見的儲存過程、函式、觸發器等。另外如主外來鍵、索引等,一旦缺失可能造成業務系統無法正常執行。因此使用者在脫敏作業中,需要選擇手動選擇需要同步的資料庫物件,以保障業務可用。

2 如何支援生產系統聯調

在開發及測試場景中,往往涉及到開發及測試系統與生產系統進行功能聯調,生產系統可能為使用者自身系統,也可能為外部生產系統。由於資料經過了脫敏處理,勢必無法與生產系統資料保持一致,從而無法進行系統聯調。

因此,需要保留極小部分資料不經過脫敏處理,而絕大部分資料正常處理。通過系統「白名單」功能,使用者可自行篩選資料不做脫敏處理。

3 生產與測試環境隔離

為了保護資料安全,使用者往往會將生產及測試環境進行隔離,彼此無法互訪。通常有三種處理方式:

將脫敏系統部署在生產環境,開通資料脫敏系統單向訪問測試環境許可權,脫敏系統從生產備庫抽取資料,經過脫敏後直接入測試庫。

將脫敏系統部署在生產環境,脫敏系統從生產備庫抽取資料,經過脫敏處理後生成資料庫備份檔案(如oracle dump)。將資料庫備份檔案轉移到測試環境後,手動匯入到測試庫。

將脫敏系統部署在測試環境,使用者手動從生產備庫匯出乙份資料庫備份檔案(如oracle dump)。將該備份檔案轉移到測試環境後,脫敏系統將該檔案作為脫敏源,對於檔案進行解析,並經過脫敏處理後直接進入測試庫。

mysql 中文脫敏 怎樣選擇資料庫脫敏系統?

目前國內廠商對資料脫敏產品已經區分靜態資料脫敏與動態資料脫敏,我分別說下這兩款產品如何選擇,應具備的功能有哪些,一款好的靜態脫敏產品應具備以下功能 確保資料脫敏有效性 保證脫敏後的資料能夠準確反映原始資料的業務屬性和資料分布特徵,例如對於原始資料中的姓名 位址 病症 企業名稱等資訊需要在脫敏後仍然具...

位址 脫敏規則 資料脫敏的處理方法

背景 需要在非生產環境下對敏感資訊進行資料脫敏,實現敏感隱私資料的可靠保護。脫敏資料特徵 1.保持原有資料特徵 例如身份證由17位數字本體碼和1位檢驗碼組成。2.保持資料之間一致性 出生年月和出生日期之間的關係。3.保持業務規則的關聯性。4.多次脫敏之間的資料一致性。脫敏的方法 1.資料替換 要求 ...

python 簡單的資料脫敏

最近要做乙個生產資料提取,涉及到隱私資料脫敏。因提取的資料是比較規範化的資料,就想到了用python的string特性來做。對於指定分隔符或者定長的檔案,使用python來實現是比較得心應手的。很簡單,幾行 完成。usr bin env python3 sourcefilepath c users ...