[发明专利]一种网页篡改检测方法、装置、设备及存储介质在审
申请号: | 202010548673.6 | 申请日: | 2020-06-16 |
公开(公告)号: | CN113806732A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 王大伟;杨荣海 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F21/64;G06F16/958;G06F40/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 张金香 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 篡改 检测 方法 装置 设备 存储 介质 | ||
1.一种网页篡改检测方法,其特征在于,应用于目标网站的本地网络设备,所述方法包括:
获得所述目标网站的目标网页,所述目标网页为在经过所述本地网络设备的流量的响应包中提取到的网页;
对所述目标网页进行解析,获得所述目标网页的文本信息;
基于所述目标网页的文本信息,对所述目标网页进行可疑判定;
如果判定所述目标网页为可疑网页,则将所述目标网页上报给云端,以使所述云端对所述目标网页进行篡改检测。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标网页的文本信息,对所述目标网页进行可疑判定,包括:
将所述目标网页的文本信息与关键词库中的关键词进行匹配;
根据匹配结果,对所述目标网页进行可疑判定。
3.根据权利要求2所述的方法,其特征在于,所述关键词库中包括严格关键词,所述根据匹配结果,对所述目标网页进行可疑判定,包括:
如果匹配结果为:所述目标网页的文本信息与所述关键词库中的严格关键词的匹配次数超过预设次数阈值,则确定所述目标网页为篡改网页。
4.根据权利要求2所述的方法,其特征在于,所述关键词库中包括宽松关键词,所述根据匹配结果,对所述目标网页进行可疑判定,包括:
如果匹配结果为:所述目标网页的文本信息中不包含所述关键词库中的任意一个宽松关键词,则确定所述目标网页为正常网页。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标网页的文本信息,对所述目标网页进行可疑判定,包括:
基于所述目标网页的文本信息,利用检测模型,确定所述目标网页是否为正常网页,所述检测模型为基于所述目标网站的正常网页训练得到的。
6.根据权利要求5所述的方法,其特征在于,所述检测模型为通过以下步骤训练获得的:
获得所述目标网站的正常网页;
在所述正常网页中确定训练网页;
基于确定出的训练网页,训练获得所述检测模型。
7.根据权利要求6所述的方法,其特征在于,所述获得所述目标网站的正常网页,包括:
获得所述目标网站的业务网页;
分别根据每个业务网页的访问模式信息,确定每个业务网页是否为正常网页。
8.根据权利要求7所述的方法,其特征在于,所述访问模式信息至少包括以下一种信息:访问频率、被不同IP访问的次数、是否被可信IP访问。
9.根据权利要求6所述的方法,其特征在于,所述在所述正常网页中确定训练网页,包括:
确定所述正常网页中请求方为设定目标的网页;
在所述正常网页的除所述请求方为设定目标的网页外的网页中,针对每个IP选择设定数量的网页,确定为训练网页。
10.根据权利要求6所述的方法,其特征在于,所述检测模型包括第一检测模型和/或第二检测模型,所述基于确定出的训练网页,训练获得所述检测模型,包括:
基于确定出的训练网页的关键词,训练获得所述第一检测模型;
和/或,
基于确定出的训练网页的访问模式信息,训练获得所述第二检测模型。
11.根据权利要求1至10之中任一项所述的方法,其特征在于,在所述对所述目标网页进行解析,获得所述目标网页的文本信息之后、所述基于所述目标网页的文本信息,对所述目标网页进行可疑判定,之前,还包括:
基于所述目标网页的文本信息,确定数据库中是否存在所述目标网页,所述数据库中包含已确定为正常网页或者篡改网页的网页的文本信息;
如果不存在,则执行所述基于所述目标网页的文本信息,对所述目标网页进行可疑判定的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010548673.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体制冷片及其制作方法
- 下一篇:一种通用型开关插座壳体