[发明专利]一种数据脱敏的处理方法、处理装置和存储介质在审

专利信息
申请号: 201910195883.9 申请日: 2019-03-15
公开(公告)号: CN111767565A 公开(公告)日: 2020-10-13
发明(设计)人: 孙秉乾;洪敬风;沈华林;胡兆丰 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F40/151;G06F16/903
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 郑红娟;宋志强
地址: 100083 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 处理 方法 装置 存储 介质
【说明书】:

本申请公开了一种数据脱敏的处理方法、处理装置和存储介质,其中,该方法包括:获取待脱敏字符串;遍历待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的待脱敏字符串中的部分连续字符确定为待脱敏数组串;在待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并进行存储;将待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并进行存储,其中,非保留字符随机确定;根据结果缓冲区中存储的各个字符,生成脱敏后字符串。本申请实施例通过识别待脱敏字符串中的各个字符,对字符进行脱敏,不需要提前定义数据格式,同时遍历各个字符,保证了脱敏的充分和完整性。

技术领域

本申请涉及数据处理技术领域,尤其涉及一种数据脱敏的处理方法、处理装置和存储介质。

背景技术

数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。通常在不违反系统规则条件的情况下,对涉及客户安全的数据或者一些商业性敏感数据等真实数据进行改造并提供测试,如身份证号、手机号、卡号、客户号等个人信息都可以进行数据脱敏处理。这样就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。

现有技术中主要是通过提前定义数据格式或者基于自然语言识别来对敏感数据进行处理。比如导入外部字典表,用于随机替换敏感数据真值,以实现数据脱敏的效果

但是对于不确定性的异构数据,现有的脱敏处理方法不能保证敏感数据都得到处理,并且处理速度较慢,脱敏效果不理想。另外,可逆的脱敏算法可以实现脱敏之后的数据追溯,但是它的有效性依赖于算法的保密或者密钥的保密,一旦泄漏,脱敏处理失效。不可逆的脱敏算法,主要基于消息摘要算法。一旦脱敏之后,数据无法追溯。而通过现有技术对敏感数据进行脱敏处理后,原有数据格式发生改变。例手机号13812345678经过脱敏处理后,变成了fb9b5908054fb6b5659c85df7151188d,无法获知原数据类型及含义,这就使得无法对脱敏后的数据进行定性分析。

发明内容

本申请实施例提供了一种数据脱敏的处理方法,该方法根据待脱敏字符串中的各个字符之间的关系,识别需要脱敏的字符,实现对待脱敏字符串的充分脱敏。

该方法包括:

获取待脱敏字符串;

遍历所述待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串;

在所述待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将所述脱敏后数组串存储在结果缓冲区;

将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字对应的遮盖字符存储在所述结果缓冲区,其中,所述非保留字符随机确定;

根据所述结果缓冲区中存储的各个字符,生成脱敏后字符串。

可选地,获取当前字符的字符类型;

在所述当前字符的所述字符类型为数字时,获取当前字符的前一个字符的字符类型;

在所述前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区;

当遍历完所述待脱敏字符串包含的所有字符后,判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数;

当所述数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串。

可选地,若所述当前字符的前一个字符的字符类型为非数字时,新建数字缓冲区,并将所述当前字符存入所述数字缓冲区。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910195883.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top