[发明专利]敏感信息检测方法、装置、设备及存储介质有效
申请号: | 202010940328.7 | 申请日: | 2020-09-09 |
公开(公告)号: | CN112134858B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 周一枫;侯姗姗;张云蕾 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感 信息 检测 方法 装置 设备 存储 介质 | ||
本发明实施方式涉及数据安全领域,公开了一种敏感信息检测方法、装置、设备及存储介质。本发明实施方式中,先获取待检测字节流报文;基于预设敏感信息检测模型中的GRU网络从待检测字节流报文中提取文本向量;在预设敏感信息检测模型中的注意力机制下处理文本向量,以得到文本特征表示信息;通过分类器对文本特征表示信息进行归一化处理,以得到敏感信息检测结果。可见,本发明实施方式中的预设敏感信息检测模型的模型结构中联合启用了GRU网络结构与注意力机制结构,通过此类结构编排方式构造出的模型结构在处理待检测字节流报文时可以大大提高检测结果的准确性,也就解决了目前的敏感信息检测方法检测准确性不高的技术问题。
技术领域
本发明实施例涉及数据安全领域,特别涉及敏感信息检测方法、装置、设备及存储介质。
背景技术
随着数据安全技术的不断发展,对于敏感信息也愈加关注。
就敏感信息的定义而言,敏感信息一般是指若被不当使用,或,若未经授权被人接触、修改后,会产生不利于国家、组织的负面影响及利益损失的特定信息。当然,敏感信息也指与个人相关的特定信息。
若以文档类信息为例,为了从海量信息中检测出敏感信息,通常地,存在着多种文档类敏感文件的识别手段。比如,可基于敏感关键词进行敏感文件的识别操作。但是,发明人发现,基于敏感关键词进行敏感文件识别的技术手段至少存在着如下问题:
虽然通过敏感关键词可以较为简便地检测出敏感文件,但是,通常只能根据特定的敏感关键词,比如,只能通过“机密”、“绝密”及“秘密”等敏感关键词来进行检测,对于较为复杂的语句或者容易存在歧义的语句的检测效果往往不佳。
可见,目前的敏感信息检测方法存在着检测准确性不高的技术问题。
发明内容
本发明实施方式的目的在于提供一种敏感信息检测方法、装置、设备及存储介质,旨在解决目前的敏感信息检测方法检测准确性不高的技术问题。
为解决上述技术问题,本发明的实施方式提供了一种敏感信息检测方法,包括以下步骤:
获取待检测字节流报文;
基于预设敏感信息检测模型中的门控循环单元GRU网络从所述待检测字节流报文中提取文本向量;
在所述预设敏感信息检测模型中的注意力机制下处理所述文本向量,以得到文本特征表示信息;
通过分类器对所述文本特征表示信息进行归一化处理,以得到敏感信息检测结果。
本发明的实施方式还提供了一种敏感信息检测装置,包括:
报文获取模块,用于获取待检测字节流报文;
GRU处理模块,用于基于预设敏感信息检测模型中的门控循环单元GRU网络从所述待检测字节流报文中提取文本向量;
注意力机制处理模块,用于在所述预设敏感信息检测模型中的注意力机制下处理所述文本向量,以得到文本特征表示信息;
结果输出模块,用于通过分类器对所述文本特征表示信息进行归一化处理,以得到敏感信息检测结果。
本发明的实施方式还提供了一种敏感信息检测设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上文所述的敏感信息检测方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的敏感信息检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010940328.7/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置