[发明专利]个人信息去标识化方法及装置在审
申请号: | 201780048000.0 | 申请日: | 2017-06-27 |
公开(公告)号: | CN109564616A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 崔大祐;劝祐奭;黄明式;金尚煜;金基兑 | 申请(专利权)人: | 飞索科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;张国香 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个人信息 候选节点 原始数据 晶格 原始表格 化层 记录 数据组成 有效地 数据库 | ||
1.一种个人信息去标识化方法,其特征在于,个人信息去标识化装置实施的个人信息去标识化方法中,包括:
从数据库获取包括记录的原始表格的步骤,该记录记入了表示个人信息的原始数据;
基于泛化水平,针对包含于所述原始表格的各个记录记入的原始数据()实施泛化,生成泛化数据的步骤;
设定由所述原始数据和所述泛化数据组成的泛化层模型的步骤;
基于所述泛化层模型表示的层次结构,生成包括多个候选节点的原始晶格的步骤,该多个候选节点表示用于指出各类个人信息的泛化水平的表格;以及
设定包括至少一个候选节点的最终晶格的步骤,该至少一个候选节点是在包含于所述原始晶格的所述多个候选节点中符合预先设定的标准的候选节点。
2.根据权利要求1所述的个人信息去标识化方法,其特征在于,所述个人信息去标识化方法还包括:针对包含于所述原始表格的各个记录分别设定属性的步骤。
3.根据权利要求2所述的个人信息去标识化方法,其特征在于,所述属性划分为ID、QI、SA和IA;将记入有原始数据的记录设定为ID,该原始数据表示明确地辨认特定个人的个人信息;将记入有原始数据的记录设定为QI,该原始数据表示默认辨认特定个人的个人信息;将记入有原始数据的记录设定为SA,该原始数据表示敏感度高于预先设定的标准的个人信息;将记入有原始数据的记录设定为IA,该原始数据表示敏感度低于SA的个人信息。
4.根据权利要求3所述的个人信息去标识化方法,其特征在于,所述个人信息去标识化方法还包括:针对包含于所述原始表格的记录中,所述属性设定为ID的记录,进行遮蔽处理的步骤。
5.根据权利要求3所述的个人信息去标识化方法,其特征在于,所述个人信息去标识化方法还包括:依据原始数据表示的个人信息的种类设定所述泛化水平的步骤,该原始数据记入在包含于所述原始表格的记录中,所述属性设定为QI的记录。
6.根据权利要求3所述的个人信息去标识化方法,其特征在于,针对记入在包含于所述表格的记录中,所述属性设定为QI的记录的原始数据,依据泛化水平进行泛化。
7.根据权利要求1所述的个人信息去标识化方法,其特征在于,设定所述最终晶格的步骤包括:
在包含于所述原始晶格的多个候选节点中选择至少一个候选节点的步骤;
基于所述至少一个候选节点表示的泛化水平,对于所述原始表格实施去标识化,从而生成去标识化表格的步骤;
将与符合预先设定的抑制标准的去标识化表格对应的候选节点设定为最终节点的步骤;以及
设定包括所述最终节点的所述最终晶格的步骤,所述最终节点与符合所述预先设定的标准的候选节点相对应。
8.根据权利要求7所述的个人信息去标识化方法,其特征在于,所述去标识化表格以K-匿名性为基础生成,或者以所述K-匿名性和L-多元性为基础生成,或者以所述K-匿名性和T-接近性为基础生成。
9.根据权利要求8所述的个人信息去标识化方法,其特征在于,所述预先设定的抑制标准表示构成所述去标识化表格的相同群组中,不符合预先设定的所述K-匿名性的相同群组的比率。
10.根据权利要求1所述的个人信息去标识化方法,其特征在于,所述个人信息去标识化方法还包括:计算与包含于所述最终晶格的至少一个最终节点对应的去标识化表格的再辨认危险性和有用性的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞索科技有限公司,未经飞索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780048000.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模型数据的载入方法、装置、设备和存储介质
- 下一篇:表征和成像微观物体的方法