[发明专利]敏感数据的脱敏方法、装置、终端设备及计算机存储介质在审
申请号: | 202211185519.2 | 申请日: | 2022-09-27 |
公开(公告)号: | CN115510485A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 韦菊梅;张亮;班定东;陈炼松;李恒玥 | 申请(专利权)人: | 上汽通用五菱汽车股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06N20/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张莉 |
地址: | 545007 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感数据 方法 装置 终端设备 计算机 存储 介质 | ||
本发明公开了一种敏感数据的脱敏方法、装置、终端设备以及计算机可读存储介质,该方法确定待脱敏的源数据;将所述源数据与预设的敏感数据字典进行匹配得到匹配结果,其中,所述敏感数据字典是通过预先构造敏感数据识别学习模型以建立敏感数据集,并根据所述敏感数据集的敏感等级预定义脱敏规则生成的;按照所述匹配结果中的脱敏规则针对所述源数据中的敏感数据进行脱敏处理。
技术领域
本发明属于数据处理技术领域,尤其涉及一种敏感数据的脱敏方法、装置、终端设备以及计算机可读存储介质。
背景技术
随着科技的发展,数据资源爆炸式增长,信息共享也成为时代的新风向。
目前,各行各业数据包含大量个人隐私数据与敏感重要数据,因此,信息共享在提供便利的同时,也增大了隐私数据泄露的风险,一旦发生数据安全事件,将造成难以预估的损失。因此,国内许多重点行业企业已意识到数据安全的重要性。然而许多企业在实际数据采集、传输、存储、处理、交换共享等环节,对敏感数据进行脱敏处理的仍存在内置数据算法单一和支持的数据源类型少的问题,从而导致无法满足多种场景下多类型数据脱敏后的开发和测试使用。
发明内容
本发明的主要目的在于提供一种敏感数据的脱敏方法、装置、终端设备以及计算机可读存储介质。旨在自动识别敏感数据并完成脱敏处理,从而实现对敏感数据的可靠保护。
为了实现上述目的,本发明提供一种敏感数据的脱敏方法,所述敏感数据的脱敏方法包括:
确定待脱敏的源数据;
将所述源数据与预设的敏感数据字典进行匹配得到匹配结果,其中,所述敏感数据字典是通过预先构造敏感数据识别学习模型以建立敏感数据集,并根据所述敏感数据集的敏感等级预定义脱敏规则生成的;
按照所述匹配结果中的脱敏规则针对所述源数据中的敏感数据进行脱敏处理。
可选地,所述的敏感数据的脱敏方法,所述方法还包括:
通过预先构造敏感数据识别学习模型以建立敏感数据集;
根据所述敏感数据集的敏感等级预定义脱敏规则生成敏感数据字典。
可选地,所述通过预先构造敏感数据识别学习模型以建立敏感数据集的步骤,包括:
通过预设的数据训练集进行模型训练以构造敏感数据识别学习模型;
基于所述敏感数据识别学习模型建立敏感数据集。
可选地,所述基于所述敏感数据识别学习模型建立敏感数据集的步骤,包括:
通过所述敏感数据学习模型针对所述数据训练集中各训练数据的输入进行自动识别得到输出,其中,所述输出包括:敏感数据、所述敏感数据对应的敏感等级和敏感标签;
根据所述敏感等级分类建立多个包括所述敏感数据、所述敏感等级和所述敏感标签的敏感数据集。
可选地,所述根据所述敏感数据集的敏感等级预定义脱敏规则生成敏感数据字典的步骤,包括:
根据所述敏感数据集的敏感等级,针对所述敏感数据集预定义脱敏规则;
根据所述脱敏规则以及所述敏感数据集中的敏感标签,生成敏感数据字典。
可选地,在所述将所述源数据与预设的敏感数据字典进行匹配的步骤之后,所述方法还包括:
若所述源数据与所述敏感数据字典匹配失败,则通过预先构造的敏感数据识别学习模型,确定所述源数据中的敏感数据、所述敏感数据对应的敏感等级和敏感标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上汽通用五菱汽车股份有限公司,未经上汽通用五菱汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211185519.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种安全防护方法、装置、设备和计算机可读存储介质
- 下一篇:轮足式三栖机器人