[发明专利]个人信息去标识化方法及装置在审
申请号: | 201780048000.0 | 申请日: | 2017-06-27 |
公开(公告)号: | CN109564616A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 崔大祐;劝祐奭;黄明式;金尚煜;金基兑 | 申请(专利权)人: | 飞索科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;张国香 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个人信息 候选节点 原始数据 晶格 原始表格 化层 记录 数据组成 有效地 数据库 | ||
本发明公开一种个人信息的去标识化方法及装置。个人信息去标识化方法包括:从数据库获取包括记录的原始表格的步骤,该记录记入了表示个人信息的原始数据;针对包含于原始表格的各个记录记入的原始数据实施泛化,生成泛化数据的步骤;设定由原始数据和泛化数据组成的泛化层模型的步骤;基于泛化层模型,生成包括多个候选节点的原始晶格的步骤;以及设定包括至少一个候选节点的最终晶格的步骤,该至少一个候选节点是在包含于原始晶格的多个候选节点中符合预先设定的标准的候选节点。因此,本发明可以更有效地进行个人信息的去标识化。
技术领域
本发明涉及一种数据处理技术,具体涉及一种基于遗传算法,对于包括个人信息在内的表格有效实施去标识化的技术。
背景技术
随着信息通信技术(例如,大数据相关技术)的发展,收集个人信息的技术、分析收集到的个人信息的技术等也得到了发展。个人信息包括居民身份证号码、住址、邮政编码、姓名、生年月日、性别、疾病、年薪等。如此,随着大数据技术的发展,个人信息可以应用于多种区域。例如,企业基于个人信息,针对特定消费者开展本公司商品、服务等的广告业务,由此,消费者从企业轻易地获取与本人需要的商品、服务相关的信息。
但是,盲目使用个人信息,可能会侵犯作为信息主体的个人的基本权利。要想解决这种弊端,可以考虑个人信息去标识化技术。去标识化技术是指删除或替代(即,针对表示个人信息的数据实施泛化)部分或全部个人信息,从而达到即使与其他数据结合也无法辨认特定个人的目的。针对个人信息实施去标识化时,根据泛化水平(level),个人信息泛化范围也会有所不同。针对所有泛化水平分别实施个人信息去标识化时,会为了生成去标识化的个人信息消耗较多的时间。
并且,各个泛化水平在个人信息的可用性、再辨认危险性等方面也会有所不同。例如,针对个人信息中相对多的部分实施泛化时,分析去标识化的个人信息时,错误出现相对多,由此会削弱去标识化个人信息的可用性。反之,针对个人信息中相对少的部分实施泛化时,可能会相对容易地推测到或再辨认到去标识化的个人信息,由此会提高去标识化个人信息的再辨认危险性。
并且,为了针对个人信息实施去标识化,首先应该从数据库获取包括个人信息的表格。从数据库获取的表格包括各种各样的较多信息,在生成包含需要信息的表格的时候,会消耗较多的时间。
发明内容
技术问题
为了解决上述问题,本发明的目的是提供一种对于个人信息有效地实施去标识化的方法及装置。
为了解决上述问题,本发明的另一目的是提供一种对于包含个人信息的表格的记录设定属性的方法及装置。
解决问题的方案
为了达到上述目的,本发明一实施例中个人信息去标识化装置实施的个人信息去标识化方法包括:从数据库获取包括记录的原始表格的步骤,该记录记入了表示个人信息的原始数据;基于泛化水平,针对包含于所述原始表格的各个记录记入的原始数据实施泛化,生成泛化数据的步骤;设定由所述原始数据和所述泛化数据组成的泛化层模型的步骤;基于所述泛化层模型表示的层次结构,生成包括多个候选节点的原始晶格的步骤,该多个候选节点表示用于指出各类个人信息的泛化水平的表格;以及设定包括至少一个候选节点的最终晶格的步骤,该至少一个候选节点是在包含于所述原始晶格的所述多个候选节点中符合预先设定的标准的候选节点。
其中,所述个人信息去标识化方法还可包括:针对包含于所述原始表格的各个记录分别设定属性的步骤。
其中,所述属性可以划分为ID、QI、SA和IA;可以将记入有原始数据的记录设定为ID,该原始数据表示明确地辨认特定个人的个人信息;可以将记入有原始数据的记录设定为QI,该原始数据表示默认辨认特定个人的个人信息;可以将记入有原始数据的记录设定为SA,该原始数据表示敏感度高于预先设定的标准的个人信息;可以将记入有原始数据的记录设定为IA,该原始数据表示敏感度低于SA的个人信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞索科技有限公司,未经飞索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780048000.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模型数据的载入方法、装置、设备和存储介质
- 下一篇:表征和成像微观物体的方法