[发明专利]一种检测网页中隐藏暗链的方法和装置在审
申请号: | 202010026013.1 | 申请日: | 2020-01-10 |
公开(公告)号: | CN113111274A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 王鑫渊;黄梅芬;洪镇宇 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 陈刚 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 网页 隐藏 方法 装置 | ||
本发明公开了一种检测网页中隐藏暗链的方法和装置,属于计算机技术领域。所述方法包括:调用webkit访问目标网站的目标页面,建立所述目标页面的Render树;检测所述Render树中的特定标签是否存在域外跳转属性和/或显示隐藏属性;若存在,则确定所述目标页面有可疑暗链并记录所述可疑暗链的属性内容。采用本发明,可以降低暗链检测设备对于网页中隐藏暗链的误报率及漏报率。
技术领域
本发明涉及计算机技术领域,特别涉及一种检测网页中隐藏暗链的方法和装置。
背景技术
随着互联网技术的发展,通过网站的网络流量获取经济收益已经是一种普遍营销方式。为此,某些网站会将其链接以在线访客不可见、但搜索引擎能搜索到的形式隐藏在其它正常网站上(俗称挂暗链),以获取大量的网络流量。这样一来,正常网站的用户流量会被分占,造成一定的经济损失;且若暗链的网站传播非法内容,还会给正常网站造成声誉损失,甚至使正常网站所属单位或个人被法律问责。故而,正常网站通常会对其网站是否被挂暗链进行检测,以防暗链对其造成不良影响。
现有技术中,大多是采用网站URL对比、敏感关键字检测(如博彩、色情等)等技术来检测网站是否被挂暗链。其中,网站URL对比可以是暗链检测设备将通过爬虫技术获取的网站下所有的URL,分别与预设的网站URL白名单进行匹配,若某一URL不在网站URL白名单中,则可以确认网站被挂暗链;敏感关键字检测可以是对上述网站URL进行访问请求,将响应页面的内容与检测装置上预设的敏感关键词库进行匹配,若某响应页面的内容中包含敏感关键词库中的内容,则可以确认网站被挂暗链。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有技术中的网站URL白名单有很大概率无法包含网站全部的URL,则检测时可能会误将不在白名单中的网站的URL判定为暗链,从而产生较高的误报率;再者,检测装置上预设的敏感关键词库可能无法包含所有的敏感关键字,则可能有些敏感关键字无法检测到,从而产生较高的漏报率。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种检测网页中隐藏暗链的方法和装置。所述技术方案如下:
第一方面,提供了一种检测网页中隐藏暗链的方法,所述方法包括:
调用webkit访问目标网站的目标页面,建立所述目标页面的Render树;
检测所述Render树中的特定标签是否存在域外跳转属性和/或显示隐藏属性;
若存在,则确定所述目标页面有可疑暗链并记录所述可疑暗链的属性内容。
第二方面,提供了一种检测网页中隐藏暗链的装置,所述装置包括:
建立模块,用于调用webkit访问目标网站的目标页面,建立所述目标页面的Render树;
检测模块,用于检测所述Render树中的特定标签是否存在域外跳转属性和/或显示隐藏属性;
记录模块,用于若存在,则确定所述目标页面有可疑暗链并记录所述可疑暗链的属性内容。
第三方面,提供了一种暗链检测设备,所述暗链检测设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的检测网页中隐藏暗链的方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的检测网页中隐藏暗链的方法。
本发明实施例提供的技术方案带来的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010026013.1/2.html,转载请声明来源钻瓜专利网。