[发明专利]一种混合数据的脱敏方法及系统有效
申请号: | 201811050576.3 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109388965B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 安宁钰;赵保华;梁潇;彭巍;方晓蓉;刘文意;宋轶慧;钱偲书 | 申请(专利权)人: | 全球能源互联网研究院有限公司;国网上海市电力公司;国家电网有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李博洋 |
地址: | 102209 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 数据 方法 系统 | ||
本发明公开了一种混合数据的脱敏方法及系统,在获取待脱敏的混合数据后,将待脱敏的混合数据进行拆分和归类,得到拆分字典集合,标记拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将识别敏感信息类型的拆分字典集合进行动态脱敏。本发明提供的混合数据的脱敏方法及系统,可实现通过建立异步线程对包含有不同类型敏感信息的混合数据进行快速脱敏,为构建安全可信的数据使用环境奠定了坚实的基础。
技术领域
本发明涉及信息安全领域,具体涉及一种混合数据的脱敏方法及系统。
背景技术
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。
大数据环境已经逐步应用于了各大企业,企业敏感数据的所有权和使用权缺乏明确界定和管理,可能造成用户隐私信息的泄露和企业内部数据的泄露,直接造成企业声誉和经济的双重损失。数据的大量汇集,使得黑客成功攻击一次就能获得更多数据,极大降低了黑客的进攻成本。因此,大数据将有可能成为网络攻击的显著目标。
在大数据环境下的数据是NoSql的存储形式,各种类型的数据并非像传统数据中一样整齐的存储,而是杂乱的存储在一起,传统的脱敏算法,只能针对单一敏感数据类型进行处理,对于大数据的NoSql存储形式中杂乱的存储的多种敏感数据类型,处理起来效果较差,同时,由于数据量巨大,效率也较为低下。
发明内容
因此,本发明提供一种混合数据的脱敏方法及系统,克服了现有技术中对混合数据进行脱敏效率低下的不足。
本发明实施例提供一种混合数据的脱敏方法,包括如下步骤:
获取待脱敏的混合数据;将待脱敏的混合数据进行拆分和归类,得到拆分字典集合;标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合;根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏。
优选地,所述将待脱敏的混合数据进行拆分和归类,得到拆分字典集合的步骤,具体包括:
根据数据类型将所述待脱敏的混合数据拆分为不同的字段数据;根据各类型敏感信息的数据特征,获取拆分字典的关键字;将进行拆分后的字段数据根据所述关键字进行归类,得到所述拆分字典集合。
优选地,所述标记所述拆分字典集合中对应的敏感信息类型,得到识别敏感信息类型的拆分字典集合的步骤,具体为:根据预设识别算法将所述拆分字典集合中各关键字和各关键字下的对应字段数据与对应的敏感信息类型进行标记,得到识别敏感信息类型的拆分字典集合。
优选地,所述数据类型包括汉字、数字、英文字母及符号中的至少一种。
优选地,所述关键字包括:数据类型和数据长度。
优选地,所述根据预设脱敏算法,使用异步线程将所述识别敏感信息类型的拆分字典集合进行动态脱敏的步骤,具体包括:
获取所述识别敏感信息类型的拆分字典集合中敏感信息类型的数量及各敏感信息类型对应的字段数据累计的总数量;
根据敏感信息类型及对应的字段数据构建待处理库;
初始化预设数量的异步线程,其中,所述预设数量小于所述敏感信息类型的数量;
使用初始化后的异步线程按照预设脱敏算法对所述敏感信息类型对应的字段数据进行脱敏处理;
判断各所述异步线程处理当前敏感信息类型对应的字段数据的数量是否小于所述字段数据的总数量与所述敏感信息类型数量的比值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全球能源互联网研究院有限公司;国网上海市电力公司;国家电网有限公司,未经全球能源互联网研究院有限公司;国网上海市电力公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811050576.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置