首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于模式匹配算法的敏感信息脱敏方法在审

申请号：	201910757737.0	申请日：	2019-08-16
公开（公告）号：	CN110489997A	公开（公告）日：	2019-11-22
发明（设计）人：	唐舸轩;石波;乔序;赵磊	申请（专利权）人：	北京计算机技术及应用研究所
主分类号：	G06F21/62	分类号：	G06F21/62
代理公司：	11011 中国兵器工业集团公司专利中心	代理人：	王雪芬<国际申请>=<国际公布>=<进入
地址：	100854***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	脱敏敏感信息模式匹配算法敏感字符串脱敏处理原始文本文本串混洗算法匹配敏感替代记录改进保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于模式匹配算法的敏感信息脱敏方法，其特征在于，包括以下步骤：

步骤1：定义待脱敏的文本数据，提取文本数据中的文本串T，后续对文本串T进行敏感信息的脱敏；

步骤2：根据需求确定需要脱敏的敏感信息为模式串P，作为对文本串T进行模式匹配的对象；

步骤3：使用Sunday算法对待脱敏的文本数据进行模式匹配，记录敏感数据位置；

步骤4：构造出敏感数据位置记录表；

步骤5：使用脱敏方法，对待脱敏的文本数据中的所有敏感数据进行脱敏处理。

2.如权利要求1所述的方法，其特征在于，所述待脱敏的文本数据为PDF文档。

3.如权利要求1所述的方法，其特征在于，设所述文本串T长度为n，则有：

T＝T₀T₁T₂T₃T₄T₅…T_n-1

其中，T_i为文本串T中一个特定的字符。

4.如权利要求3所述的方法，其特征在于，步骤2中，根据用户需求确定需要进行脱敏的敏感信息，定义模式串P的长度为m，m<n，则有：

P＝P₀P₁P₂P₃P₄P₅…P_m-1

在文本串T中匹配给定的模式串P，若模式串P出现在了文本串T中，且：

T_iT_i+1T_i+2T_i+3T_i+4…T_i+m-1＝P₀P₁P₂P₃P₄P₅…P_m-1

则认为匹配成功，此时P₀在文本串T中的位置为i，将i作为敏感数据位置的坐标。

5.如权利要求4所述的方法，其特征在于，步骤3包括如下步骤：

步骤3.1：按照左对齐原则将文本串T和模式串P对齐；

步骤3.2：将文本串T和模式串P从右向左进行比较，此时从最右边的字符开始比较，若P_m-1与T中跟其位置对齐的字符相同，则执行步骤3.4，否则执行步骤3.3；

步骤3.3：若T中正在匹配的字符为坏字符，则执行步骤3.3.1，否则执行步骤3.3.2；

步骤3.3.1：此时字符匹配不成功是因为坏字符引起的，并且文本串T的当前字符右边的字符仍然不能和模式串P的右边第一个字匹配时，模式窗口则需要向右移动m+1的长度，并且返回步骤3.2；如果文本串T的当前字符右边的字符和模式串P右边第一个字匹配时，模式窗口则需要向右移动m的长度，并且返回步骤3.2；

步骤3.3.2：此时字符匹配不成功不是因为坏字符引起的，则在模式串P中由右向左查找第一次出现T中正在匹配的字符的地方与文本串T对齐，返回步骤3.2继续下一轮匹配；

步骤3.4：此时已经在文本串T中找到与模式串P最右侧的第一个字符匹配的字符，则P和T均继续向左取下一个字符继续匹配，当发现字符不匹配时，返回步骤3.3判断T中正在匹配的字符是否为坏字符，否则P和T均继续向左取下一个字符继续匹配，直至P₀匹配完毕且均未发现不匹配的情况，此时执行步骤3.5；

步骤3.5：返回文本串T中与P₀对应的位置作为敏感数据位置记录表的坐标i，判断文本串T是否已经检索完毕，检索完毕则执行步骤4；否则取待脱敏的文本数据中剩下未检索的文本串T’，返回至步骤3.1中将文本串T替换为文本串T’，并将模式串P与文本串T’重新进行匹配。

6.如权利要求5所述的方法，其特征在于，步骤4中构造出敏感数据位置记录表，将每次执行步骤3.5时返回的位置坐标依次插入到位置记录表中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所，未经北京计算机技术及应用研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910757737.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种数据库数据安全管理方法及系统
下一篇：一种可搜索加密方法、装置、设备及可读存储介质

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top