[发明专利]敏感数据扫描方法和系统有效
申请号: | 202010565631.3 | 申请日: | 2020-06-19 |
公开(公告)号: | CN111737742B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王若曾 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F9/54;G06F16/25 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200120 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感数据 扫描 方法 系统 | ||
1.一种敏感数据扫描方法,其特征在于,包括:
数据采样模块读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;
所述消息中间件将所述数据样本进行存储;
扫描节点集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并对所述数据样本进行扫描,得到敏感数据;
所述扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据,包括:扫描节点集群中的每个扫描节点确定所述数据样本的长度;如果所述数据样本的长度超过设定长度阈值,所述每个扫描节点采用文本分类器对所述数据样本进行敏感数据分类;如果所述数据样本的长度未超过设定长度阈值,所述每个扫描节点采用至少一个正则表达式分别对所述数据样本进行敏感数据筛选;其中,所述至少一个正则表达式分别为不同种类敏感数据的筛选逻辑公式。
2.根据权利要求1所述的方法,其特征在于,所述数据采样模块读取目标数据库中的数据样本,包括:
数据采样模块读取目标数据库的元数据;
所述数据采样模块根据所述元数据确定读取范围,并读取所述读取范围内的数据样本。
3.根据权利要求2所述的方法,其特征在于,在所述数据采样模块读取所述读取范围内的数据样本之后,还包括:
所述数据采样模块对所述读取范围内的数据样本进行设定处理,得到所述数据样本;
其中,所述设定处理包括设定类型字段的过滤处理、空数据样本过滤处理和去重处理中的至少一项。
4.根据权利要求1所述的方法,其特征在于,在所述数据采样模块读取目标数据库中的数据样本之前,还包括:
功能接口层获取目标数据库的信息,并将所述目标数据库的信息存储至配置数据库中;
所述数据采样模块读取目标数据库中的数据样本,包括:
数据采样模块从所述配置数据库中读取所述目标数据库的信息,并根据所述目标数据库的信息链接所述目标数据库;
数据采样模块从链接到的所述目标数据库读取数据样本。
5.根据权利要求4所述的方法,其特征在于,在所述功能接口层将所述目标数据库的信息存储至配置数据库中之后,还包括:
所述配置数据库将所述目标数据库的扫描状态设置为待扫描;
所述配置数据库响应于所述数据采样模块发送的执行状态信息,设置所述目标数据库的扫描状态。
6.根据权利要求1-5任一项所述的方法,其特征在于,在所述扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据之后,还包括:
所述每个扫描节点将所述敏感数据存储至缓存;
同步模块将所述敏感数据从所述缓存中同步至扫描结果数据库。
7.根据权利要求6所述的方法,其特征在于,在所述同步模块将所述敏感数据从所述缓存中同步至扫描结果数据库之后,还包括:
功能接口层获取所述扫描结果数据库的存储数据量;
所述功能接口层获取所述扫描节点集群扫描到的敏感数据的数据量;
如果所述存储数据量和所述敏感数据的数据量之差在设定范围内,所述功能接口层生成扫描报告,并将配置数据库中所述目标数据库的扫描状态设置为扫描结束。
8.一种敏感数据扫描系统,其特征在于,包括:
数据采样模块,用于读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;
所述消息中间件,用于将所述数据样本进行存储;
扫描节点集群,用于通过所述集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并对所述数据样本进行扫描,得到敏感数据;
扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据,包括:扫描节点集群中的每个扫描节点确定所述数据样本的长度;如果所述数据样本的长度超过设定长度阈值,所述每个扫描节点采用文本分类器对所述数据样本进行敏感数据分类;如果所述数据样本的长度未超过设定长度阈值,所述每个扫描节点采用至少一个正则表达式分别对所述数据样本进行敏感数据筛选;其中,所述至少一个正则表达式分别为不同种类敏感数据的筛选逻辑公式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010565631.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交互过程的控制方法、装置、存储介质及设备
- 下一篇:一种光学镜头