[发明专利]一种软件大数据脱敏方法在审
申请号: | 201810605601.3 | 申请日: | 2018-06-13 |
公开(公告)号: | CN110598437A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 罗刚林 | 申请(专利权)人: | 罗刚林 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征码 反馈结果 脱敏 外部设备 预存 数据库 源代码 采集 输入数据库 保留数据 采集数据 对比结果 数据采集 数据对比 数据发送 大数据 原数据 比对 删除 变形 存储 反馈 输出 检测 | ||
本发明公开了一种软件大数据脱敏方法,其特征在于,所述方法包括如下步骤:S1:在数据采集后将采集的数据进行检测,通过预先输入数据库的特征码与采集的数据进行的特征码进行比对,将采集数据的特征码与数据库内预存的特征码一致的数据进行列出;S2:将列出的数据进行的预存特征码进行删除,并保留数据的其他数据源代码,将处理后的数据与原数据进行数据对比,将对比结果输出至外部设备;S3:通过外部设备进行反馈,并根据反馈结果进行下一步操作,若反馈结果为终止,则停止对处理后的数据进行脱敏,直接将处理后的数据发送至数据库内进行存储,若反馈结果需要进行脱敏,进入步骤S4;S4:将处理后的数据中加入数据变形码。
技术领域
本发明涉及一种软件大数据脱敏方法,具体涉及一种软件大数据脱敏方法。
背景技术
现有技术下,为了保障数据使用过程中的安全,一般采用数据脱敏的方法,对敏感数据进行脱敏,但是已有的方法都是针对数据库进行脱敏,具体的过程如下:
1、基于规则的方式识别数据库中的敏感数据和敏感字段;
2、采用遮挡、替换、随机变换、加密的方式对敏感数据进行脱敏;
3、记录数据脱敏的日志,以供用户查询脱敏任务的执行情况。
随着数据隐私保护越来越重要,政府和企业都采用了数据库脱敏的方式来保障数据的安全,但是仍然存在以下问题:
1、数据资源有结构化、半结构化和非结构化的数据类型,目前,大多数据研究都只针对结构化的数据库数据,如何对图片、文件和多媒体(视频、音频)进行敏感数据脱敏仍然处于探索阶段,没有成熟的方法和流程。
2、已有的敏感数据识别大都是基于规则发现和人工定义的方法,基于规则发现的方法可以有效识别符合规则定义的敏感数据,但是会遗漏掉大量无规则的敏感数据,降低敏感数据识别的准确率;另一方面基于人工定义的方式在数据量比较大的情况下,会增加用户的负担,降低系统的可用性与易用性。
3、现有的数据脱敏仅仅考虑了单个节点敏感数据的识别,忽略了多级部门的敏感数据脱敏及监管的问题。
4、数据拥有者和政府如何对数据脱敏的过程进行监控,分析脱敏日志,实时审计,监测异常行为,及时防止敏感数据泄露,是大部分数据脱敏系统并未考虑的问题,却是亟待解决的问题。
因此,大数据领域亟需一种安全、高效的大数据脱敏方法,既可以实现各种数据类型的敏感数据精准识别与数据脱敏,保障数据的可用性,又可以保证数据脱敏性能的同时,实现敏感数据的多级安全管理。
发明内容
本发明所要解决的技术问题是需要在高效的进行大数据脱敏时,还能够对数据内的异常数据进行判断分离删除,保证存储数据的准确、安全,目的在于提供一种软件大数据脱敏方法,解决上述的问题。
本发明通过下述技术方案实现:
一种软件大数据脱敏方法,其特征在于,所述方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗刚林,未经罗刚林许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810605601.3/2.html,转载请声明来源钻瓜专利网。