[发明专利]一种网页篡改检测方法、装置、设备及存储介质在审

专利信息
申请号: 202010548673.6 申请日: 2020-06-16
公开(公告)号: CN113806732A 公开(公告)日: 2021-12-17
发明(设计)人: 王大伟;杨荣海 申请(专利权)人: 深信服科技股份有限公司
主分类号: G06F21/55 分类号: G06F21/55;G06F21/64;G06F16/958;G06F40/30
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 张金香
地址: 518055 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网页 篡改 检测 方法 装置 设备 存储 介质
【说明书】:

本申请公开了一种网页篡改检测方法,应用于目标网站的本地网络设备,该方法包括:获得目标网站的目标网页,目标网页为在经过本地网络设备的流量的响应包中提取到的网页;对目标网页进行解析,获得目标网页的文本信息;基于目标网页的文本信息,对目标网页进行可疑判定;如果判定目标网页为可疑网页,则将目标网页上报给云端,以使云端对目标网页进行篡改检测。应用本申请实施例所提供的技术方案,可以适用于各种场景的网页篡改检测,而且,云端只需要对本地网络设备上报的可疑网页进行篡改检测,减少了对大量的正常网页的检测过程,可以提高检测效率。本申请还公开了一种网页篡改检测装置、设备及存储介质,具有相应技术效果。

技术领域

本申请涉及计算机应用技术领域,特别是涉及一种网页篡改检测方法、装置、设备及存储介质。

背景技术

网页篡改(Webpage Defacement),是指黑客入侵合法网站,在合法网站中插入非法文本、图像及恶意链接等行为。网页篡改是黑帽搜索引擎优化的常见手段,通过网页篡改可以增加目的网站在搜索引擎的权重,提升目的网站在搜索引擎中的排名,为目的网站增加访问量,获取更多流量。但是,这会降低合法网站在搜索引擎的排名,给其造成较大经济损失,同时也会影响企业形象。所以,很多网站都需要进行网页篡改检测。

在现有技术中,多是基于云端进行网页篡改检测。具体做法是,利用爬虫爬取网站的网页,再对网页进行量级/复杂性更高但准确度也更高的分析,确定是否为篡改网页。

但是,这种方法存在多个弊端。首先,云端缺乏全网爬取能力,云端爬虫无法获取孤链篡改网页,也就无法检测到孤链篡改网页。孤链是一种特殊的网页篡改形式,黑客上传篡改网页后,在该网站服务器A中无本地链接指向此篡改网页,同时,黑客在其控制的另一台服务器B上增加链接指向此篡改网页。因此,针对网站服务器A的普通爬虫无法爬取到该孤链篡改网页,而只有拥有全网爬取能力的爬虫,如搜索引擎才能够通过网站B爬取到该孤链篡改网页。其次,为了躲避云端检测手段,篡改者经常会使用cloaking机制,返回正常内容给云端爬虫,而只将恶意内容返回给攻击目标,这样将使得云端爬虫很难获取到恶意网页。也就是说,云端很难检测到使用cloaking机制的篡改网页。再次,云端会对其通过爬虫爬取到的所有网页进行检测,而云端爬虫爬取到的网页大多是网站的正常网页,这将会使得检测效率较低。

发明内容

本申请的目的是提供一种网页篡改检测方法、装置、设备及存储介质,以适应多种场景的网页篡改检测,提高检测效率。

为解决上述技术问题,本申请提供如下技术方案:

一种网页篡改检测方法,应用于目标网站的本地网络设备,所述方法包括:

获得所述目标网站的目标网页,所述目标网页为在经过所述本地网络设备的流量的响应包中提取到的网页;

对所述目标网页进行解析,获得所述目标网页的文本信息;

基于所述目标网页的文本信息,对所述目标网页进行可疑判定;

如果判定所述目标网页为可疑网页,则将所述目标网页上报给云端,以使所述云端对所述目标网页进行篡改检测。

在本申请的一种具体实施方式中,所述基于所述目标网页的文本信息,对所述目标网页进行可疑判定,包括:

将所述目标网页的文本信息与关键词库中的关键词进行匹配;

根据匹配结果,对所述目标网页进行可疑判定。

在本申请的一种具体实施方式中,所述关键词库中包括严格关键词,所述根据匹配结果,对所述目标网页进行可疑判定,包括:

如果匹配结果为:所述目标网页的文本信息与所述关键词库中的严格关键词的匹配次数超过预设次数阈值,则确定所述目标网页为篡改网页。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010548673.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top