在线观看一区二区三区三州_日韩精品免费播放_日韩中文娱乐网_日韩欧美一区二

2021-07-08

數據脫敏4 | 法律可以量化評價數據脫敏的效果嗎?

作者: 楊建媛

“大數據”已然從熱詞變成日常,而數據在釋放無限潛力的同時,也引發了隱私泄露的巨大隱患。從若干年前科技公司野蠻生長,到近年來數據立法接踵而至,信息社會正在兩極之間尋求平衡。數據脫敏提供了這樣一種可能性——通過降低數據與主體之間的關聯,可以同時保留較高的隱私保護程度和較大的數據利用價值。

“數據脫敏”專題文章將梳理匿名化、去標識化、假名化等一系列相關概念,分析中國、歐盟、美國等法域對不同概念的法律評價,介紹數據脫敏的技術方案與隱私模型,探討各個業務場景下的行業實踐案例與法律落地方案,以推動數據利用和隱私保護的平衡發展。

上期回顧:數據脫敏可以采用統計、密碼、抑制、假名化、泛化、隨機化、數據合成等技術。法律對脫敏技術的評價并非機械對應,而是考量特定的技術方案、實施強度和應用場景,具體評價其實現的不可識別的程度。

那么,法律上如何衡量脫敏的效果,即不可識別的程度呢?本文將介紹傳統的定性標準(如第三人標準、安全港標準)和專門的定量標準(如K-匿名、差分隱私模型),并探討通過數據分析進一步精細化的量化評價路徑。


一、評價脫敏效果的定性標準


法律上的標準往往不是精確的數字,而是定性的描述。就脫敏效果的標準而言,各國法上都有第三人標準,同時,也有立法試圖列舉應當被“脫”的數據項。

1、第三人標準

第三人標準是常見的立法例,各國法上的主要差異在于第三方的性質和范圍。

美國《健康保險流通與責任法案》(HIPAA)對健康數據的去標識化提出了專家測定標準(Expert Determination),即經過具備統計知識與科學方法的專家的測定,考慮到數據接收者合理可得的數據和合理可用的技術,從脫敏后的健康信息中識別出個人的風險非常小。

英國信息專員辦公室(Information Commissioners Office)在《匿名化:管理數據保護風險的實踐準則》中提出了的有動機的入侵者測試(Motivated Intruder Test),即對于并非內幕人士或專業黑客的一般第三人而言,通過公開檢索、詢問、調查等方式,匿名信息能否被重識別。

我國國家標準《個人信息去標識化指南》則分別提出了針對外部一般人員和內部違規人員的入侵者測試。

2、安全港標準

美國HIPPA就健康信息的去標識化提出了安全港標準(Safe Harbor),指去除18項標識符,并且數據處理者不認為處理后的信息能夠單獨或結合地識別個人。這18項標識符包括姓名、小于州的地理信息、小于年的日期信息、電話號碼、傳真號碼、電子郵箱地址、社會保險號、病歷號、健康計劃受益人號、銀行賬號、證書號、車輛識別號、設備識別符、URL地址、IP地址、生物識別符、正面照片、其他唯一識別符號。

與之類似的是,上海市衛生健康委員會在新冠疫情流調報告中去除了確診病例的姓名、性別、年齡等標識符,僅公開時間、區域和場所等信息,從而保護了病人的隱私。

但是,HIPPA的安全港標準也受到批評——18項標識符的列舉并不周延,并且刪除標識符并不意味著去標識化,尤其對于較小的樣本量或罕見的屬性值,個人仍然可能被識別。例如,1000人中的Rh陰性血很可能指向唯一的個人。


二、評價脫敏效果的定量標準


我國的《個人信息去標識化指南》、歐盟的《關于匿名化技術的意見》、國際標準化組織的《隱私增強數據去標識化術語和技術分類》(ISO/IEC 20889)都介紹了K-匿名模型、差分隱私模型,運用數學的方法為數據脫敏和隱私保護提供了定量的評價標準。

1、K-匿名模型

哈佛大學教授Latanaya Sweeney研究指出,結合出生日期、性別、郵政編碼這三項屬性可以識別出87%的美國人,因此她于1998年提出了K-匿名。K-匿名(K-anonymity)是指,對某一標識符進行一定程度的泛化,使得對于任一屬性值,至少有K個數據主體共享同一屬性值。

如下圖,假設有一個可供公開查詢的數據庫,包含出生日期、住址、患病情況這三項屬性。一個攻擊者已知其攻擊目標張三的出生日期(1950年2月1日)、住址(北京市朝陽區建外街道幸福小區),并試圖獲取張三的患病情況。

pastedGraphic.png

在原始數據庫,攻擊者通過出生日期和住址就能鎖定張三,從而暴露其患有高血壓。如果將出生日期泛化至出生年月、將小區泛化至街道,則與張三共享這兩項屬性的人增加至10人(K=10),因此攻擊者無法從等價類中識別出張三。但是,如果攻擊所針對的敏感屬性(患病情況)的屬性值差異很小,則K-匿名的效果有限。例如,居住在建外街道、1950年2月出生的10人都患有高血壓,則攻擊者可以確定其張三也患有高血壓。

L-多樣性(L-diversity)在K-匿名的基礎上,要求每一等價類在每一敏感屬性上至少有L個不同的屬性值。例如,當進一步泛化至居住在北京市朝陽區、1950年出生的人,這200人患有高血壓或心臟病(L=2,指兩種疾病),則攻擊者無法確定張三患有哪種病。但是,如果敏感屬性值的分布不均,則L-多樣性的效果有限。例如,200人中有10個心臟病,190個高血壓,則攻擊者可以推理出張三大概率也患有高血壓。

T-接近性(T-closeness)在L-多樣性的基礎上,要求敏感屬性在任何等價類中的分布與其在整個數據集中的分布相近,兩者差距小于閾值T。但對于發病概率與年齡強相關的疾病,比較難通過泛化出生日期來實現T-接近性。例如,老年人更容易得高血壓,則在張三的等價類中,高血壓的患者可能遠多于整個數據集平均情況。

2、差分隱私模型

差分隱私(differential privacy)是指,通過向數據集中添加隨機噪聲,使得任意個人的記錄對該數據集或其子集的統計特性影響極小。這種噪聲(如拉普拉斯噪聲)是經過精心設計、符合概率分布的,從而使攻擊者無法從數據集的查詢結果及其組合中篩選出某一個人,但這不可避免地導致數據在一定程度上失真。

例如,一個社區中高血壓的患病人數為40人,當新搬來一個住戶后,如果患病人數變為41人,則可以判斷新住戶患有高血壓,導致其隱私泄露(統計數據并不一定是匿名的)。添加噪聲之后,假設患病人數仍為40人,但40是一個有噪聲的、非確切的數字,因此無法判斷新住戶的患病情況。

差分隱私模型為隱私保護程度提供了嚴格的數學定義。如下圖,基于給定的隱私預算ε(指愿意忍受的隱私風險),對于數據集中任意兩個相鄰數據集D1、D2,當一個查詢函數f的敏感度為S,如果某一隨機算法M滿足概率公式Pr[M(D1)] ≤ exp(ε) × Pr[M(D2)],則該算法M實現了“ε-差分隱私”。

pastedGraphic_1.png


三、進一步的量化標準


上述的定性標準和定量標準都為脫敏效果的衡量提供了參考,但是,它們都沒有徹底回答衡量標準的問題。

第三人標準聚焦于重識別的主體,各國分別界定了第三人的性質和范圍,如專家、內幕人員、外部的一般第三人等。但是,第三人標準并沒有明確第三人在測試數據集時應當使用的方法和標準,因此,企業難以自查和判斷數據脫敏的效果。

安全港標準試圖列舉出若干的標識符,引導企業刪除這些敏感的屬性值,這或許可以在特定行業內提供脫敏的最低門檻。但是,數據不是孤立的,數據之間是存在聯系的,即使去除了標識符,若干的非敏感屬性值相結合,也可能推導出數據主體的身份。

K-匿名模型和差分隱私模型突破了傳統的定性標準,對脫敏的程度進行了數學上的定義,為效果的度量提供了量化的工具。但是,各國法上只給出了K、L、T、ε等參數,卻并未對其進行賦值。K>10就是去標識化嗎?K>10000就是匿名化嗎?數據脫敏真的有明確的量化標準嗎?

這些數字或許永遠不會有標準答案,但實踐中不妨借助數據的力量,模擬出一個相對科學的衡量標準。例如,就同一行業、相似的業務場景抽樣100家企業及其數據集,并設定統一的數據可用性需求和隱私保護要求,再由各個企業分別對其數據集進行脫敏處理。對于脫敏后的數據集,通過K-匿名或差分隱私模型進行驗證,計算出各個數據集的K/L/T/ε值,并對這100組數值進行排列與分析,從而大致推算出當前實踐中可以接受的K/L/T/ε標準。


本期小結與下期預告:對于脫敏效果的衡量,既有定性的第三人標準、安全港標準,也有定量的K-匿名模型、差分隱私模型。目前,不可識別的程度并沒有精確的度量方法,但可以通過特定場景下的實證研究,進一步探索量化的標準。那么,既然不可識別的程度是漸進的,數據脫敏的法律效果也是漸進的嗎?下期文章將為您分析現行法下假名化、去標識化、匿名化的法律地位。


聯系我們
地址:北京市朝陽區東三環中路5號
財富金融中心20層(郵編100020)
電話:+86 10 8560 6888
傳真:+86 10 8560 6999
郵件:haiwenbj@haiwen-law.com
地址:上海市南京西路1515號靜安嘉里中心一座26層(郵編200040)
電話:+86 21 6043 5000
傳真:+86 21 5298 5030
郵件:haiwensh@haiwen-law.com
地址:深圳市福田區中心四路1號
嘉里建設廣場第三座3801室(郵編518048)
電話:+86 755 8323 6000
傳真:+86 755 8323 0187
郵件:haiwensz@haiwen-law.com
地址:香港中環港景街1號 國際金融中心一期6樓601-602及610-616室
電話:+852 3952 2222
傳真:+852 3952 2211
郵件:haiwenhk@haiwen-law.com
地址:成都市高新區交子大道233號
中海國際中心C座20層01、11-12單元(郵編610041)
電話:+86 28 6391 8500
傳真:+86 28 6391 8397
郵件:haiwencd@haiwen-law.com
在线观看一区二区三区三州_日韩精品免费播放_日韩中文娱乐网_日韩欧美一区二
视频一区免费观看| 日韩精品一区二区三区电影| 亚洲不卡中文字幕| 欧美区高清在线| 久久久精品国产一区二区三区| 欧美成年人视频网站| 欧美亚洲日本网站| 久久96国产精品久久99软件| 无码av天堂一区二区三区| 成人国产一区二区| 欧美激情a在线| 国产日韩欧美在线| 国产精品久久久久久久天堂第1集| 日韩免费在线观看视频| 131美女爱做视频| 亚洲精品高清视频| 久久久一二三四| 欧美一级淫片播放口| 99色精品视频| 中文字幕一区二区三区乱码| 国产精品一二三在线观看| 蜜桃网站成人| 精品国产一区二区三区在线| 国产肉体ⅹxxx137大胆| 久久成人精品一区二区三区| 精品一区二区三区视频日产| 国产精品久久久久7777婷婷| 加勒比海盗1在线观看免费国语版| 久久久精品视频在线观看| 欧美成人综合一区| 国产精品成av人在线视午夜片| 国产aaa一级片| 成人国产亚洲精品a区天堂华泰| 国产精品国产三级国产aⅴ9色| 韩国日本不卡在线| 免费91麻豆精品国产自产在线观看| 国产精品自拍视频| 午夜精品一区二区三区在线视频 | 国产精品狠色婷| 国产一级不卡毛片| 最新av网址在线观看| 国产精品99导航| 秋霞久久久久久一区二区| 日韩专区中文字幕| 国模吧无码一区二区三区| 在线视频精品一区| 久久成人资源| 国产在线999| 午夜精品一区二区在线观看的| 日韩在线观看你懂的| 国产在线观看福利| 亚洲国产欧美不卡在线观看| 久久久久久伊人| 国产自产在线视频| 亚洲欧美丝袜| 色噜噜国产精品视频一区二区| 国产一区视频免费观看| 亚洲巨乳在线观看| 久久久久久久少妇| 国产日韩中文在线| 日本一区网站| 精品国产免费久久久久久尖叫 | 免费国产一区二区| 亚洲a成v人在线观看| 国产精品网站大全| 91精品视频观看| 男人添女人下部视频免费| 亚洲高清资源综合久久精品| 俺去了亚洲欧美日韩| 成人精品在线观看| 日韩av不卡电影| 国产99久久久欧美黑人| 久99久视频| 国产精品自产拍在线观看| 国产精品久久久91| 黄色国产精品视频| 久久久久这里只有精品| 久久精品久久精品国产大片| 欧美极品jizzhd欧美| 男人天堂新网址| 久久综合一区二区三区| 久久久久亚洲精品成人网小说 | 欧美xxxx14xxxxx性爽| 狠狠97人人婷婷五月| 亚洲精品成人久久久998| 国产精品啪啪啪视频| 国产精品6699| 国产裸体舞一区二区三区| 欧美亚洲免费高清在线观看| 亚洲 欧美 日韩 国产综合 在线 | 国产精品视频精品视频| 久久久999免费视频| 国产一区二区香蕉| 欧美精彩一区二区三区| 日产中文字幕在线精品一区| 正在播放国产精品| 久久精品免费播放| 久久国产精品-国产精品| 91九色在线观看| 高清视频一区二区三区| 国产在线播放91| 精品视频免费观看| 麻豆91av| 美女视频久久| 加勒比海盗1在线观看免费国语版| 日本成人黄色免费看| 亚洲 自拍 另类小说综合图区| 久久久久久com| 欧美激情国产高清| 精品国产乱码久久久久久108 | 岛国视频一区免费观看| 中文字幕色呦呦| 美日韩精品免费观看视频| 国产精品精品软件视频| 久久久精品2019中文字幕神马 | 日韩在线观看免费网站| 久久99久久99精品| 国产成+人+综合+亚洲欧洲| 97精品国产97久久久久久免费| 隔壁老王国产在线精品| 高清在线观看免费| 浮妇高潮喷白浆视频| 国产专区精品视频| 国产在线一区二区三区欧美| 激情伊人五月天| 国内精品模特av私拍在线观看| 激情网站五月天| 免费av观看网址| 国产欧美最新羞羞视频在线观看| 精品视频在线观看一区二区 | 国产日韩欧美影视| 国产精品一区二区欧美| youjizz.com亚洲| 97精品视频在线| 97精品免费视频| 99久久国产免费免费| 91精品国产高清久久久久久91 | 国产高清不卡无码视频| 久久久久久久久四区三区| 三级精品视频久久久久| 国产精品沙发午睡系列| 国产精品久久久久9999| 一区二区三区在线视频看| 亚洲高清123| 日韩精品一区二区三区色欲av| 欧美日韩国产一二| 国产欧美在线观看| 成人av.网址在线网站| 国产二级片在线观看| 精品国产一区二区三区久久狼5月| 国产精品久久久久久久久久东京| 欧美成人精品影院| 亚洲人成网站在线观看播放| 日本一区二区三区四区视频| 男人的天堂狠狠干| 成人精品久久一区二区三区| 久久免费视频1| 国产精品美女www| 一区二区在线观| 日韩少妇内射免费播放| 黄色片久久久久| www.欧美黄色| 久久九九国产视频| 国产精品福利在线观看网址| 亚洲自拍的二区三区| 日韩精品一区二区三区四| 国产偷人视频免费| 国产xxxxx在线观看| 久久的精品视频| 色噜噜一区二区| 国内精品久久久久伊人av| 91精品视频免费看| 国产精品久久久一区二区三区| 岳毛多又紧做起爽| 欧美日韩精品免费观看| 啊啊啊一区二区| 国产精品美女www| 亚洲人成网站在线播放2019 | 久久久久国产一区二区三区| 日本一区二区在线视频| 久久精品视频在线播放| 日本免费久久高清视频| 久久精品国产精品亚洲色婷婷| 精品久久一二三| 国内精品久久国产| 国产精成人品localhost| 久久国产天堂福利天堂| 欧美一区二区影视| 久久综合伊人77777尤物| 热草久综合在线| 久久久精品美女| 99电影在线观看| 久久伦理网站| 久久久久久久久久婷婷| 99久久精品久久久久久ai换脸 | 91精品久久香蕉国产线看观看| 国产嫩草一区二区三区在线观看| 男人添女人下部视频免费| 欧美久久电影| 精品无人乱码一区二区三区的优势 |