[发明专利]一种政务大数据脱敏处理方法及装置在审
申请号: | 201811018476.2 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109190405A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 马莉 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 王国标 |
地址: | 528000 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脱敏 大数据 敏感数据 脱敏处理 字段节点 跨系统 读取 跨平台测试 数据库存储 数据实体 隐私信息 兼容性 序列化 遍历 预置 数据库 转化 | ||
1.一种政务大数据脱敏处理方法,其特征在于,所述方法包括以下步骤:
步骤1,读取政务大数据的数据实体;
步骤2,将政务大数据的数据实体进行序列化转化为XML序列化对象;
步骤3,遍历读取XML序列化对象得到各个字段节点;
步骤4,通过预置的数据脱敏规则将各个字段节点的敏感数据依次进行数据脱敏。
2.根据权利要求1所述的一种政务大数据脱敏处理方法,其特征在于,在步骤1中,所述政务大数据的数据实体至少包括统一社会信用代码、企业名称、用户名称、身份证号码、电话号码、邮箱号、银行卡号、IP地址、联系地址。
3.根据权利要求1所述的一种政务大数据脱敏处理方法,其特征在于,在步骤2中,将政务大数据的数据实体进行序列化转化为XML序列化对象包括以下子步骤,
步骤2.1,根据政务大数据的数据实体统一社会信用代码或身份证号码创建XML文件的根节点对象,并将该根节点对象插入XML文件的文档对象中,其中,如果政务大数据为企业信息则以统一社会信用代码作为XML文件的根节点对象,如果政务大数据为自然人信息则以身份证号码作为XML文件的根节点对象;
步骤2.2,判断政务大数据的数据实体中是否还有下一行数据,如果存在下一行数据,转至步骤2.3,如果不存在下一行数据,转至步骤2.7;
步骤2.3,获得政务大数据的数据实体中的数据实体名,设为T,创建以T为元素名的父节点对象,所述数据实体名为统一社会信用代码、企业名称、用户名称、身份证号码、电话号码、邮箱号、银行卡号、IP地址、联系地址;
步骤2.4,判断政务大数据的数据实体中是否还有下一个数据实体名,如果存在下一个数据实体名,设为第x个数据实体名,从政务大数据的数据实体中取出存在下一个数据实体名的行中第x个数据值,定义为y,转至步骤2.5继续执行;如果不存在下一个数据实体名,将父节点对象插入根节点对象中,并将y存储到数组A中,转至步骤2.2继续执行,所述数组A,即数组A[i][j]为20行20列的数组,i、j范围为0~19;
步骤2.5,创建以数据实体名为元素名的子节点对象;并将数据实体名与数组A中第一列的数据进行比对,如果数组A的第一列数据中没有与数据实体名相匹配的数据,则以y作为子节点的文本值,插入子节点对象中,转至步骤2.7;若数组A的第一列数据中存在相匹配的数据,转至步骤2.6继续执行;
步骤2.6,将创建的子节点对象插入父节点对象中,转至步骤2.7继续执行;
步骤2.7,得到XML序列化对象。
4.根据权利要求1所述的一种政务大数据脱敏处理方法,其特征在于,在步骤3中,遍历读取XML序列化对象得到各个字段节点的遍历方法为深度优先搜索,所述XML序列化对象由多个字段节点组成,字段节点之间的结构为树状结构或者线性结构。
5.根据权利要求1所述的一种政务大数据脱敏处理方法,其特征在于,在步骤4中,通过预置的数据脱敏规则将各个字段节点的敏感数据依次进行数据脱敏的方法为:
步骤4.1,根据预置的数据脱敏规则设定的敏感数据类型判断字段节点的数据是否属于敏感数据;所述预置的数据脱敏规则为统一社会信用代码、身份证号码、电话号码的数据生成规则,设定统一社会信用代码、身份证号码、电话号码为敏感数据类型;
步骤4.2,按照变换规则替换敏感数据类型的字段节点的数据,直到XML序列化对象中所有敏感信息键-值对的敏感字段替换完毕;所述变换规则属于现有技术中的任何一种,如直接替换、变位替换,所谓直接替换就是用新生字段直接替换敏感字段,所谓变位替换就是将新生字段的位置变换打乱以后替换敏感字段,例如对于身份证号,可以将新生字段的身份证号的第一位数字和第二位数字换位以后再替换敏感字段的身份证号。
6.一种政务大数据脱敏处理装置,其特征在于,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在所述装置的以下单元中:
数据实体读取单元,用于读取政务大数据的数据实体;
序列化单元,用于将政务大数据的数据实体进行序列化转化为XML序列化对象;
节点遍历单元,用于遍历读取XML序列化对象得到各个字段节点;
数据脱敏单元,用于通过预置的数据脱敏规则将各个字段节点的敏感数据依次进行数据脱敏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811018476.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据脱敏系统
- 下一篇:一种分布式存储权限校验方法、权限查询方法及装置