[发明专利]敏感数据扫描方法和系统有效

专利信息
申请号: 202010565631.3 申请日: 2020-06-19
公开(公告)号: CN111737742B 公开(公告)日: 2023-06-20
发明(设计)人: 王若曾 申请(专利权)人: 建信金融科技有限责任公司
主分类号: G06F21/62 分类号: G06F21/62;G06F9/54;G06F16/25
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 200120 上海市浦东新区中国(*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 敏感数据 扫描 方法 系统
【权利要求书】:

1.一种敏感数据扫描方法,其特征在于,包括:

数据采样模块读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;

所述消息中间件将所述数据样本进行存储;

扫描节点集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并对所述数据样本进行扫描,得到敏感数据;

所述扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据,包括:扫描节点集群中的每个扫描节点确定所述数据样本的长度;如果所述数据样本的长度超过设定长度阈值,所述每个扫描节点采用文本分类器对所述数据样本进行敏感数据分类;如果所述数据样本的长度未超过设定长度阈值,所述每个扫描节点采用至少一个正则表达式分别对所述数据样本进行敏感数据筛选;其中,所述至少一个正则表达式分别为不同种类敏感数据的筛选逻辑公式。

2.根据权利要求1所述的方法,其特征在于,所述数据采样模块读取目标数据库中的数据样本,包括:

数据采样模块读取目标数据库的元数据;

所述数据采样模块根据所述元数据确定读取范围,并读取所述读取范围内的数据样本。

3.根据权利要求2所述的方法,其特征在于,在所述数据采样模块读取所述读取范围内的数据样本之后,还包括:

所述数据采样模块对所述读取范围内的数据样本进行设定处理,得到所述数据样本;

其中,所述设定处理包括设定类型字段的过滤处理、空数据样本过滤处理和去重处理中的至少一项。

4.根据权利要求1所述的方法,其特征在于,在所述数据采样模块读取目标数据库中的数据样本之前,还包括:

功能接口层获取目标数据库的信息,并将所述目标数据库的信息存储至配置数据库中;

所述数据采样模块读取目标数据库中的数据样本,包括:

数据采样模块从所述配置数据库中读取所述目标数据库的信息,并根据所述目标数据库的信息链接所述目标数据库;

数据采样模块从链接到的所述目标数据库读取数据样本。

5.根据权利要求4所述的方法,其特征在于,在所述功能接口层将所述目标数据库的信息存储至配置数据库中之后,还包括:

所述配置数据库将所述目标数据库的扫描状态设置为待扫描;

所述配置数据库响应于所述数据采样模块发送的执行状态信息,设置所述目标数据库的扫描状态。

6.根据权利要求1-5任一项所述的方法,其特征在于,在所述扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据之后,还包括:

所述每个扫描节点将所述敏感数据存储至缓存;

同步模块将所述敏感数据从所述缓存中同步至扫描结果数据库。 

7.根据权利要求6所述的方法,其特征在于,在所述同步模块将所述敏感数据从所述缓存中同步至扫描结果数据库之后,还包括:

功能接口层获取所述扫描结果数据库的存储数据量;

所述功能接口层获取所述扫描节点集群扫描到的敏感数据的数据量;

如果所述存储数据量和所述敏感数据的数据量之差在设定范围内,所述功能接口层生成扫描报告,并将配置数据库中所述目标数据库的扫描状态设置为扫描结束。

8.一种敏感数据扫描系统,其特征在于,包括:

数据采样模块,用于读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;

所述消息中间件,用于将所述数据样本进行存储;

扫描节点集群,用于通过所述集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并对所述数据样本进行扫描,得到敏感数据;

扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据,包括:扫描节点集群中的每个扫描节点确定所述数据样本的长度;如果所述数据样本的长度超过设定长度阈值,所述每个扫描节点采用文本分类器对所述数据样本进行敏感数据分类;如果所述数据样本的长度未超过设定长度阈值,所述每个扫描节点采用至少一个正则表达式分别对所述数据样本进行敏感数据筛选;其中,所述至少一个正则表达式分别为不同种类敏感数据的筛选逻辑公式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010565631.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top