[发明专利]一种敏感信息检测方法、装置及电子设备有效
申请号: | 201811624706.X | 申请日: | 2018-12-28 |
公开(公告)号: | CN109766719B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 丁玲 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/951;G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 刘昕;南霆 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 信息 检测 方法 装置 电子设备 | ||
1.一种敏感信息检测方法,其特征在于,所述方法包括:
获取可疑文件集合,所述可疑文件集合包括至少一个可疑文件;
从每一个可疑文件的文件内容中提取登陆账号和登录密码进行账号登录,
当所述可疑文件中至少一个账号登陆成功时,将所述可疑文件确定为包含敏感信息的第一目标文件;
通过预先建立的敏感信息识别模型,对所述可疑文件集合中所述第一目标文件之外的可疑文件进行识别,获取包含敏感信息的第二目标文件;
其中,所述可疑文件集合包括文件名称与敏感信息关键词匹配的可疑文件,和/或文件内容与敏感信息关键词匹配的可疑文件;则,
获取可疑文件集合,具体包括:
根据敏感信息关键词对文件名称和文件内容进行扫描,根据扫描结果获取文件名称与敏感信息关键词匹配的可疑文件,和/或文件内容与敏感信息关键词匹配的可疑文件。
2.根据权利要求1所述的方法,其特征在于,所述敏感信息识别模型,是通过下述方法建立的:
获取与敏感信息关键词匹配的文件集合;
对所述文件集合内文件进行审核,确定审核结果,所述审核结果分为文件包含敏感信息和文件不包含敏感信息;
将所述文件集合中每个文件和对应的审核结果作为一个样本,构建样本集;
将所述样本集划分为训练集和测试集,利用训练集和随机森林模型构建所述敏感信息识别模型;
利用测试集对所述敏感信息识别模型进行测试。
3.根据权利要求1所述的方法,其特征在于,在获取包含敏感信息的第二目标文件之后,所述方法还包括:
将所述第一目标文件和第二目标文件的相关数据存储于数据库,所述相关数据包括下述至少一种:
文件名称、文件地址、文件描述信息、文件创建时间和所触发的敏感信息关键词。
4.根据权利要求1所述的方法,其特征在于,在获取包含敏感信息的第二目标文件之后,所述方法还包括:向所述第一目标文件和第二目标文件关联人员发送预警邮件。
5.根据权利要求1所述的方法,其特征在于,在获取可疑文件集合之前,所述方法还包括:
根据历史统计所确定的误报优先级顺序设定敏感信息关键词;则,
获取可疑文件集合,具体包括:根据所设定的敏感信息关键词对文件进行扫描,获取所述可疑文件集合。
6.一种敏感信息检测装置,其特征在于,所述装置包括:信息获取单元、登录单元和敏感信息识别单元,其中:
信息获取单元,用于获取可疑文件集合,所述可疑文件集合包括至少一个可疑文件;其中,所述可疑文件集合包括文件名称与敏感信息关键词匹配的可疑文件,和/或文件内容与敏感信息关键词匹配的可疑文件;则,获取可疑文件集合,具体包括:根据敏感信息关键词对文件名称和文件内容进行扫描,根据扫描结果获取文件名称与敏感信息关键词匹配的可疑文件,和/或文件内容与敏感信息关键词匹配的可疑文件;
登录单元,用于从每一个可疑文件的文件内容中提取登陆账号和登录密码进行账号登录,当所述可疑文件中至少一个账号登陆成功时,将所述可疑文件确定为包含敏感信息的第一目标文件;
敏感信息识别单元,用于通过预先建立的敏感信息识别模型,对所述所述可疑文件集合中所述第一目标文件之外的可疑文件进行识别,获取包含敏感信息的第二目标文件。
7.根据权利要求6所述的装置,其特征在于,在获取可疑文件集合之前,具体还包括:
根据历史统计所确定的误报优先级顺序设定敏感信息关键词;则,
获取可疑文件集合,具体包括:根据所设定的敏感信息关键词对文件进行扫描,获取所述可疑文件集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811624706.X/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置