[发明专利]敏感信息检测方法、装置、设备与计算机可读存储介质在审
申请号: | 202011036671.5 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112052364A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 刘宇滨 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/31;G06F21/62;G06F21/64 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感 信息 检测 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明公开了一种敏感信息检测方法,包括:向目标地址发送第一请求和第二请求,以得到第一请求对应的第一内容和第二请求对应的第二内容;基于第一内容和第二内容,确定目标地址对应的目标内容;确定目标内容对应的原始字符,并提取原始字符中的目标标签;基于目标标签,生成目标页面,并检测目标页面中是否存在目标敏感信息,以获得检测结果。本发明还公开了一种敏感信息检测装置、设备和计算机可读存储介质。本发明通过同一地址的两次请求,剔除地址中动态因素的干扰,从而得到固定的内容,再通过提取标签,生成包含完整数据的页面,使得页面的内容固定且完整,再在该页面中进行敏感信息的检测,提高了敏感信息检测的准确率。
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及敏感信息检测方法、装置、设备与计算机可读存储介质。
背景技术
近年来,随着金融科技(Fintech),尤其是互联网金融的不断发展,信息检测技术被引入银行等金融机构的日常服务中。在银行等金融机构的日常服务过程中,为避免敏感信息,如银行等金融机构的报价信息等被他人上传至外部网站,导致银行等金融机构的敏感信息被外人获知,银行等金融机构往往需要对敏感信息进行泄露检测,以便及时知晓敏感信息被泄露,从而采取补救措施,如删除等。
目前的敏感信息检测方式主要通过对页面进行HTML关键字检测,从而识别敏感信息是否被发布在该页面上,具体的,获取该页面的HTML源码,再对HTML源码进行关键字识别,从而判断是否存在敏感信息,如HTML源码中有关键字“关于印发xxx四项制度的通知”,则表示可能泄露了某银行机构的公文。
此种敏感信息检测方式仅针对HTML源码关键字进行识别,并不能排除一些动态因素的影响,如广告等,且HTML源码并不代表真正的数据,如含有资源请求的标签,以及代码执行后才能获取的数据等并不能直接获得,可见,目前的敏感信息检测方式由于动态因素的干扰或者无法获取到真正的数据,导致检测准确率较低。
发明内容
本发明的主要目的在于提出一种敏感信息检测方法、装置、设备与计算机可读存储介质,旨在提高敏感信息检测的准确率。
为实现上述目的,本发明提供一种敏感信息检测方法,所述敏感信息检测方法包括如下步骤:
向目标地址发送第一请求和第二请求,以得到第一请求对应的第一内容和第二请求对应的第二内容;
基于第一内容和第二内容,确定所述目标地址对应的目标内容;
确定所述目标内容对应的原始字符,并提取所述原始字符中的目标标签;
基于所述目标标签,生成目标页面,并检测所述目标页面中是否存在目标敏感信息,以获得检测结果。
优选地,所述目标标签包括内容标签和样式标签,所述基于所述目标标签,生成目标页面的步骤包括:
确定所述内容标签的第一层级关系,并基于第一层级关系和所述内容标签,构建文档模型树;
确定所述样式标签的第二层级关系,并基于第二层级关系和所述样式标签,构建样式模型树;
基于所述文档模型树和所述样式模型树,生成渲染树;
遍历所述渲染树的节点,并基于所述节点和所述节点的节点关系,生成目标页面。
优选地,所述基于第一层级关系和所述内容标签,构建文档模型树的步骤包括:
依次确定所述内容标签的标签类型;
若当前内容标签为脚本标签,则执行所述脚本标签对应的执行代码,并在所述执行代码执行完毕之后,确定下一内容标签的标签类型;
若当前内容标签为资源标签,则获取所述资源标签对应的资源,并将所述资源生成文档节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011036671.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置