[发明专利]敏感信息检测方法、装置、设备与计算机可读存储介质在审

专利信息
申请号: 202011036671.5 申请日: 2020-09-27
公开(公告)号: CN112052364A 公开(公告)日: 2020-12-08
发明(设计)人: 刘宇滨 申请(专利权)人: 深圳前海微众银行股份有限公司
主分类号: G06F16/903 分类号: G06F16/903;G06F16/31;G06F21/62;G06F21/64
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 张志江
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 敏感 信息 检测 方法 装置 设备 计算机 可读 存储 介质
【说明书】:

发明公开了一种敏感信息检测方法,包括:向目标地址发送第一请求和第二请求,以得到第一请求对应的第一内容和第二请求对应的第二内容;基于第一内容和第二内容,确定目标地址对应的目标内容;确定目标内容对应的原始字符,并提取原始字符中的目标标签;基于目标标签,生成目标页面,并检测目标页面中是否存在目标敏感信息,以获得检测结果。本发明还公开了一种敏感信息检测装置、设备和计算机可读存储介质。本发明通过同一地址的两次请求,剔除地址中动态因素的干扰,从而得到固定的内容,再通过提取标签,生成包含完整数据的页面,使得页面的内容固定且完整,再在该页面中进行敏感信息的检测,提高了敏感信息检测的准确率。

技术领域

本发明涉及金融科技(Fintech)技术领域,尤其涉及敏感信息检测方法、装置、设备与计算机可读存储介质。

背景技术

近年来,随着金融科技(Fintech),尤其是互联网金融的不断发展,信息检测技术被引入银行等金融机构的日常服务中。在银行等金融机构的日常服务过程中,为避免敏感信息,如银行等金融机构的报价信息等被他人上传至外部网站,导致银行等金融机构的敏感信息被外人获知,银行等金融机构往往需要对敏感信息进行泄露检测,以便及时知晓敏感信息被泄露,从而采取补救措施,如删除等。

目前的敏感信息检测方式主要通过对页面进行HTML关键字检测,从而识别敏感信息是否被发布在该页面上,具体的,获取该页面的HTML源码,再对HTML源码进行关键字识别,从而判断是否存在敏感信息,如HTML源码中有关键字“关于印发xxx四项制度的通知”,则表示可能泄露了某银行机构的公文。

此种敏感信息检测方式仅针对HTML源码关键字进行识别,并不能排除一些动态因素的影响,如广告等,且HTML源码并不代表真正的数据,如含有资源请求的标签,以及代码执行后才能获取的数据等并不能直接获得,可见,目前的敏感信息检测方式由于动态因素的干扰或者无法获取到真正的数据,导致检测准确率较低。

发明内容

本发明的主要目的在于提出一种敏感信息检测方法、装置、设备与计算机可读存储介质,旨在提高敏感信息检测的准确率。

为实现上述目的,本发明提供一种敏感信息检测方法,所述敏感信息检测方法包括如下步骤:

向目标地址发送第一请求和第二请求,以得到第一请求对应的第一内容和第二请求对应的第二内容;

基于第一内容和第二内容,确定所述目标地址对应的目标内容;

确定所述目标内容对应的原始字符,并提取所述原始字符中的目标标签;

基于所述目标标签,生成目标页面,并检测所述目标页面中是否存在目标敏感信息,以获得检测结果。

优选地,所述目标标签包括内容标签和样式标签,所述基于所述目标标签,生成目标页面的步骤包括:

确定所述内容标签的第一层级关系,并基于第一层级关系和所述内容标签,构建文档模型树;

确定所述样式标签的第二层级关系,并基于第二层级关系和所述样式标签,构建样式模型树;

基于所述文档模型树和所述样式模型树,生成渲染树;

遍历所述渲染树的节点,并基于所述节点和所述节点的节点关系,生成目标页面。

优选地,所述基于第一层级关系和所述内容标签,构建文档模型树的步骤包括:

依次确定所述内容标签的标签类型;

若当前内容标签为脚本标签,则执行所述脚本标签对应的执行代码,并在所述执行代码执行完毕之后,确定下一内容标签的标签类型;

若当前内容标签为资源标签,则获取所述资源标签对应的资源,并将所述资源生成文档节点;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011036671.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top