[发明专利]数据脱敏方法、装置、系统及计算机可读介质有效

专利信息
申请号: 202110598739.7 申请日: 2021-05-31
公开(公告)号: CN113254995B 公开(公告)日: 2023-06-23
发明(设计)人: 朱孔亮;史晨阳;彭晓;孙纪周;邢世伟 申请(专利权)人: 中国光大银行股份有限公司
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 北京东方尚禾专利代理事务所(特殊普通合伙) 11844 代理人: 别佳晨
地址: 100085 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 方法 装置 系统 计算机 可读 介质
【权利要求书】:

1.一种数据脱敏方法,其特征在于,

加载格式化原始数据表,使得原始数据表中的若干字段能够被处理,和加载根据随机周期变动的词库;

获得不同于已标定密钥的一个随机偏移量作为统一密钥,记录所述统一密钥为一个新的已标定密钥并保持所述统一密钥在所述处理中为固定值;

对每个所述字段进行正则识别并标记,使得根据所述标记进行相应的所述处理;

所述标记包括普通标记和特殊标记;

对于被所述普通标记的所述字段,将所述字段进行分词,然后进行词语整理,对于其中的词语进行相应词库内偏移处理,以及其中的非词语进行以字母或数字或汉字的单独偏移处理生成所述字段的脱敏数据;

对于被所述特殊标记的所述字段,将所述字段进行分段偏移脱敏生成所述字段的脱敏数据;

将所述脱敏数据存储进所述字段;

所述的词库包括特征库和/或通用库;

其中所述的特征库包括特殊字符码表,和/或别称码表,和/或空字符码表,和/或词性码表,和/或字义码表,和/或特殊联动码表;

其中所述的通用库至少包括预存储的一个通用编码表;

还包括至少一个规则集;

所述的脱敏数据包括至少一个结果库;

所述的对于被所述普通标记的所述字段,将所述字段进行分词包括如下步骤:

步骤一,将字段内所有字符拆分为单独字符;

步骤二,从左至右读取单独字符,判断是否读取到下一单独字符,如果为否,临时队列字符组成词语进入结果栈,清空临时队列,跳出;如果为是,跳转到步骤三;

步骤三,判断是否为空字符;如果为是,临时队列字符组成词语进入结果栈,清空临时队列,跳转到步骤二;如果为否,跳转到步骤四;

步骤四,字符放入临时队列;

步骤五,临时队列中,依据队列中字符字义构成临时队列的字符组词性;

步骤六,字符组词性判断;如果为未知,跳转到步骤七;如果为已知,跳转到步骤八;

步骤七,词性码表中的枚举不可用表中查询匹配;跳转到步骤九;

步骤八,词性码表中的一个或多个已知词性表中查询匹配;跳转到步骤九;

步骤九,判断匹配结果;如果存在完全一致匹配,跳转到步骤十一;如果存在严格子串匹配,跳转到步骤二;如果不存在匹配,跳转到步骤十;

步骤十,判断上一次匹配存在且为严格子串,如果为是,跳转到步骤十三;如果为否,跳转到步骤十二;

步骤十一,字符组词性调整为对应匹配表的词性,成词语后进入结果栈,清空临时队列;跳转到步骤二;

步骤十二,字符组词性调整为未知,成词语后进入结果栈,清空临时队列;跳转到步骤二;

步骤十三,当前字符退出临时队列,字符组词性不变;当前字符组成词语词性设为未知,顺序进入结果栈,清空临时队列,跳转到步骤二;

所述的词语整理包括如下步骤:

步骤二十一,将结果栈中词语逆向读取;

步骤二十二,从右向左读取单个词语;判断是否读取到下一词语,如果否,临时栈中连续同词性词语组合为新的词语,词性不变,跳出;如果是,跳转到步骤二十三;

步骤二十三,词语放入临时栈;

步骤二十四,由临时栈中词语顺序、词语词性与规则集进行比对;

步骤二十五,判断是否调整;如果否,跳转到步骤二十二;如果是,跳转到步骤二十六;

步骤二十六,根据规则集中匹配条件选择修改当前词语词性或选择临时栈中多个词语组合成新的词语;跳转到步骤二十二;

所述的词语进行相应词库内偏移处理,以及其中的非词语进行以字母或数字或汉字的单独偏移处理生成所述字段的脱敏数据包括如下步骤:

步骤三十一,临时栈中连续同词性词语组合为新的词语,词性不变;

步骤三十三,依次读取临时栈中词语,判断是否读取到下一词语;如果否,跳转到步骤三十四;如果是,跳转到步骤三十五;

步骤三十四,结果队列词语拼接,顺序导出得到偏移后字段,存入结果库,跳出;

步骤三十五,判断是否为未知词性;如果否,跳转到步骤三十六;如果是,跳转到步骤五十一;

步骤三十六,为词性对应的词性码表构建所述规则集中的关键帧映射,当前词语在对应的词性码表中查找匹配关键帧;

步骤三十七,判断是否一致匹配;如果是,跳转到步骤三十八,如果否,跳转到步骤三十九;

步骤三十八,记录匹配词语在对应的词性码表中的关键帧;跳转到步骤四十;

步骤三十九,当前词语添加至对应的词性码表中,并增加所述规则集中的关键帧映射,并记录关键帧;跳转到步骤四十;

步骤四十,关键帧与标定密钥、本次脱敏的统一密钥共同参与关键帧映射的反射,得到反射后的词语;该词语为偏移后的词语,存入结果队列;跳转到步骤三十三;

步骤五十一,将词语内所有字符拆分,为单个字符,关联通用库;

步骤五十二,依次读取字符跳转到步骤五十三,直到全部字符处理后直接跳转到步骤五十七;

步骤五十三,判断字符,分为大写英文字母、小写英文字母、数字、汉字,关联通用库中通用编码表对应区域;

步骤五十四,对应区域构成匹配编码表,为匹配编码表构建关键帧映射,在匹配编码表中查找匹配关键帧;

步骤五十五,关键帧与标定密钥、本次脱敏的统一密钥,共同参与对应映射的反射,得到反射后的偏移字符,存入临时队列;跳转到步骤五十二;

步骤五十七,临时队列重组为词语,存入结果队列;跳转到步骤三十三;

对于被所述特殊标记的所述字段,将所述字段进行分段偏移脱敏生成所述字段的脱敏数据包括如下步骤:

步骤七十一,分段处理,每段成个体,每个个体赋予对应的码表类型;

步骤七十二,依次读取每段个体,判断是否读取到下一段;如果是,跳转到步骤七十三;如果否,结果队列个体拼接,顺序导出得到偏移后字段,存入结果库,跳出;

步骤七十三,判断码表类型;如果是通用编码表,跳转到步骤七十五;如果是特殊联动码表,跳转到步骤九十;如果是特殊字符码表,跳转到步骤八十二;

步骤七十五,将个体所有字符拆分为单个字符,关联通用库;

步骤七十六,依次读取字符,直到全部字符被处理;当字符全部处理后,临时队列重组为个体,存入结果队列,跳转到步骤七十二;

步骤七十七,判断字符,分为大写英文字母、小写英文字母、数字、汉字,关联通用库中编码表对应分类范围;

步骤七十八,对应范围构成匹配编码表,为表构建关键帧映射,在匹配编码表中查找匹配关键帧;

步骤七十九,关键帧与标定密钥、本次脱敏的统一密钥,共同参与对应映射的反射,得到反射后偏移字符,存入临时队列;跳转到步骤七十六;

步骤八十二,该段个体不做操作,存入结果队列;跳转到步骤七十二;

步骤九十,依据相关字段值,把条件限定至特殊联动码表中的指定范围;

步骤九十一,指定范围构成匹配编码表,为表构建关键帧映射,依据本段个体,在匹配编码表中查找匹配关键帧;

步骤九十二,关键帧与标定密钥、本次脱敏的统一密钥,共同参与对应映射的反射,得到反射后的偏移字符,存入临时队列;跳转到步骤七十二。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国光大银行股份有限公司,未经中国光大银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110598739.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top