[发明专利]一种基于自然语言处理的数据脱敏方法和系统在审
申请号: | 202011228918.3 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112307751A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 王茂帅;郭涛 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F21/62;G06N3/04;G06N3/08 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 数据 方法 系统 | ||
本发明公开一种基于自然语言处理的数据脱敏方法和系统,其中,数据脱敏方法包括:使用预设处理算法对获取到的数据进行自然语言处理,得到语言处理结果;根据用户需求,设置与所述语言处理结果对应的脱敏策略;按照所述脱敏策略、使用服务网格代理技术对所述数据进行数据脱敏操作,得到脱敏后的所述数据。本发明的技术方案能解决现有技术中的数据脱敏方式,脱敏的可靠性和易用性差的问题。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于自然语言处理的数据脱敏方法和系统。
背景技术
现代社会已进入大数据时代,在大数据时代下,通过大数据分析等手段,海量数据中隐藏的价值得以挖掘;但大数据分析也带来用户隐私信息泄漏与关键性敏感数据保护失效等方面的问题。为解决上述问题,规避数据风险,相关技术中采用数据脱敏技术以进行数据保护。
传统的数据脱敏方式是根据不同种类的数据源人工设置脱敏规则,采取不同的脱敏方法,编写不同程序,应用不同配置的服务平台,从而对数据进行脱敏的。这种脱敏方式因为人工干预大,配置成本高,兼容性差、对用户的专业素养要求高,因此降低了数据脱敏的可靠性和易用性。
发明内容
本发明提供了一种基于自然语言处理的数据脱敏方法和系统,旨在解决现有技术中数据脱敏方式,人工干预大,匹配成本高,数据脱敏的可靠性和易用性差的问题。
为实现上述目的,根据本发明的第一方面,本发明提供了一种基于自然语言处理的数据脱敏方法,包括:
使用预设处理算法对获取到的数据进行自然语言处理,得到语言处理结果;
根据用户需求,设置与语言处理结果对应的脱敏策略;
按照脱敏策略、使用服务网格代理技术对数据进行数据脱敏操作,得到脱敏后的数据。
优选地,所述使用预设处理算法对获取到的数据进行自然语言处理的步骤,包括:
使用集成学习算法,结合多种自然语言处理模型对数据进行自然语言处理,分别得到多种模型预测结果;
使用预设共识算法对多种模型预测结果进行投票表决,得到语言处理结果。
优选地,所述使用预设处理算法对获取到的数据进行自然语言处理的步骤,包括:
获取服务节点发送的数据;
解析数据包含的自然语言内容;
使用预设学习算法,对数据包含的自然语言内容进行词性标注和实体识别。
优选地,所述根据用户需求,设置与语言处理结果对应的脱敏策略的步骤,包括:
获取用户选定的特定实体和脱敏规则;
控制服务节点从识别到的实体中匹配特定实体,并按照脱敏规则对数据中与特定实体的词性相同的实体进行脱敏。
优选地,所述按照脱敏策略、使用服务网格代理技术对数据进行数据脱敏操作的步骤,包括:
将脱敏策略发送至服务节点,以使服务节点按照脱敏策略对数据进行数据脱敏;
获取服务节点对数据的脱敏粒度;
判断数据的脱敏粒度是否在预设脱敏粒度范围内;
若判定脱敏粒度不在预设脱敏粒度范围内,则向服务节点发送脱敏粒度纠偏信息,以稳定服务节点的脱敏粒度。
根据本发明的第二方面,本发明还提供了一种基于自然语言处理的数据脱敏系统,包括:
语言处理模块,用于使用预设处理算法对获取到的数据进行自然语言处理,得到语言处理结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011228918.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置