学合规-美国隐私法案中的去标识化要求

个保法对匿名化的定义是 “是指个人信息经过处理无法识别特定自然人且不能复原的过程”。 与此同时,GDPR将匿名数据定义为“与已识别或可识别的自然人的个人数据无关的数据”,即数据主体“不可识别或不再可识别”。 也就是说它们要求个人数据在处理后要实现了完全的不可重识别,才能算是非个人数据。通过上一篇文章,我们知道这样的匿名化是一种基本上无法实现的理想状态,没有落地的可能性。

而世界另一端的美国因为鼓励数据流通走了一条不同的路线,我们今天介绍美国隐私法案中数据匿名化的要求。

一、CCPA

加州消费者隐私法案(CCPA)中规定了去标识化的数据就不再属于个人信息,而不是国内的个保法及欧洲的GDPR要求的匿名化。

CCPA中对去标识化的要求,比个保法要更多,它的定义中明确约定

去标识化是指信息无法在合理地被直接或间接的被识别/关联到某个具体的消费者,同时使用去标识化数据的组织

1)实施了技术措施来禁止去标识化数据的再识别;

2)实施了业务流程来禁止去标识化数据的再识别;

3)实施了业务流程阻止去标识化数据的疏忽泄漏;

4)不尝试重新识别去标识化数据

所以,它包含了去标识化这样的数据处理过程,也要求有足够的手段来防止数据再识别(等同于个保法中的“复原”,意指重新连接上或转化出个人身份识别符)。第一点的技术措施应该是指可复原的难度,比如用了2048位的加密算法,暴力破解可行性低。第二和第三点可以通过与合作伙伴的商务合同条款来进行约定,不允许对方进行再识别及大规模披露。第四点更像是主观意愿,应该通过SOP及内部培训来规范。

二、HIPAA

在美国的国家层面的健康医疗安全法案(HIPAA)中,对数据去标识化的定义和要求也是类似的。 它明确约定了数据在去标识化后,不再被认为是需要被保护的医疗信息(PHI-Protected Health Information),不再受HIPAA中隐私条款的约束。

图1-HIPAA去标识要求

它提供了两种方式: 专家确认法和安全港

 1. 专家确认法

通过雇佣相关专家,对数据进行处理,并能证明合理性。

1-专家需在使用统计学或其他科学方法处理数据方面,有足够的知识和经验。

2-专家通过应用数据处理方法,确定处理后的信息被单独或结合其他信息识别出特定个人的风险非常小

3-组织记录这些方法和结果,并证明其合理性

那如何选择专家?HIPAA没有特定的认证计划来制定谁是合格的专家,相关的专业知识应该是通过教育和工作获取,这类专家可以从统计,数学或其他科学领域。从执法角度设计,审计办公室将审查组织所使用的专家的专业经验和学习背景,以及使用PHI去标识化方法的经验。

2. 安全港

安全港的要求是删除明确规定的如下18类个人识别符,且组织认为剩余信息无法用来识别出该信息对应的个人。

1-Names — 姓名

2-All geographic subdivisions smaller than a state — 精确到州以下级别的地址信息

3-Any dates (except year) directly related to an individual — 可直接关联个人的日期数据(精确到年以下)

4-All dates including the year for those over the age of 89 - 可关联到89岁以上人群的日期数据(包括只到具体某一年)

5-Telephone numbers — 电话

6-Vehicle serial numbers and identifiers — 车牌号

7-Fax numbers - 传真

8-Device serial numbers and identifiers — 设备号

9-Email addresses - 邮箱地址

10-Universal resource locators (URLs) 

11-Social security numbers — 身份证号 

12-Internet Protocol (IP) address — IP

13-Medical record numbers — 医疗纪录编号

14-Biometric identifiers including voice and fingerprints — 生物识别符,包括指纹和声纹

15-Health plan beneficiary numbers — 医疗计划编号/社保卡号

16-Full-face pictures or images - 人脸照片

17-Account numbers — 银行账号

18-Certificate or license numbers — 证书编号

我们可以用这个列表做一个参考,来判断在实际操作中哪类数据字段是要执行去标识化的。第一种是敏感的个人生物信息,指纹/声纹/人脸,这一类高风险的敏感信息在任何场景下,都要考虑第一时间进行加密或去标识化。 第二种是强识别符,也就是在各类系统中的唯一编号,社保号是医疗系统的编号,电话号码和手机设备号是通信系统的唯一编号等。第三类是弱识别符,包括姓名,IP,地址等。针对日期数据,可以不做删除,而是进行泛化,把精度保留到年这一个级别。


最后做一个总结:

为了促进数据的流通,美国的隐私法规认为去标识化的数据不再是受保护个人数据,并给了操作指引,便于落地实施。为了防止去标识化后数据的复原,法规要求同时有技术措施和业务流程进行保障。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容