[发明专利]一种网页探测方法及装置有效
申请号: | 201711278421.0 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108171082B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 岳炳词 | 申请(专利权)人: | 新华三信息安全技术有限公司 |
主分类号: | G06F21/64 | 分类号: | G06F21/64;G06F16/958 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 张聪聪;马敬 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种网页探测方法及装置,方法包括:预先对原始网页进行采样,得到原始采样数据,将原始采样数据与网页的标识对应存储;当对网页进行探测时,在预先存储的原始采样数据中,获取待探测网页的标识对应的原始采样数据,并对待探测网页进行采样,得到当前采样数据,判断该原始采样数据与该当前采样数据是否相同,如果相同,确定待探测网页未被篡改。可见,本方案中将原始采样数据与当前采样数据进行对比,相比于现有方案中,将原始网页的全部内容与待探测网页的全部内容进行对比,减少了对比耗时,提高了探测效率。 | ||
搜索关键词: | 一种 网页 探测 方法 装置 | ||
确定待探测网页的标识;
在预先存储的原始采样数据中,获取所述标识对应的原始采样数据;
对所述待探测网页进行采样,得到当前采样数据;
判断所获取的原始采样数据与所述当前采样数据是否相同;
如果所述原始采样数据与所述当前采样数据相同,确定所述待探测网页未被篡改。
2.根据权利要求1所述的方法,其特征在于,所述确定待探测网页的标识,包括:接收用户终端发送的访问请求,将所述访问请求中携带的统一资源定位符URL确定为待探测网页的标识;
或者,每隔预设时间段,按照预设顺序依次将存储的各网页的URL确定为待探测网页的标识。
3.根据权利要求1所述的方法,其特征在于,所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,包括:在预先存储的原始网页数据长度中,获取所述标识对应的原始网页数据长度;
获取所述标识对应的待探测网页数据长度;
判断所获取的原始网页数据长度与所述待探测网页数据长度是否相同;
如果相同,则在预先存储的原始采样数据中,获取所述标识对应的原始采样数据。
4.根据权利要求1或3所述的方法,其特征在于,所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,包括:在预先存储的探测表项中,查找包含所述标识的探测表项;
如果查找到,读取查找到的探测表项中包含的原始采样数据;
如果未查找到,从备份服务器中获取所述标识对应的原始网页,对所述原始网页进行采样,得到原始采样数据。
5.根据权利要求1所述的方法,其特征在于,所述确定待探测网页的标识,包括:读取用户终端发送的访问请求中携带的URL;
若所读取的URL指向动态网页,则将所读取的URL中的动态序号调整为预设序号,将调整后的URL确定为待探测URL;
所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,包括:
在预先存储的原始采样数据中,获取所述待探测URL对应的原始采样数据;
对所述待探测网页进行采样,得到当前采样数据,包括:
对所述待探测URL对应的待探测网页进行采样,得到当前采样数据。
6.根据权利要求1或3所述的方法,其特征在于,所述在预先存储的原始采样数据中,获取所述标识对应的原始采样数据,包括:在预先存储的网页的标识及与所述标识对应的探测标记中,获取所述待探测网页的标识对应的探测标记;
判断所获取的探测标记是否为未篡改标记;
如果为未篡改标记,在预先存储的原始采样数据中,获取所述待探测网页的标识对应的原始采样数据;
所述方法还包括:
在判定所获取的原始采样数据与所述当前采样数据不同的情况下,将所述待探测网页的标识对应的探测标记调整为篡改标记。
7.根据权利要求1或4所述的方法,其特征在于,所述方法还包括:如果所述原始采样数据与所述当前采样数据不同,则从备份服务器中获取与所述标识对应的原始网页;
向用户终端发送所述原始网页。
8.一种网页探测装置,其特征在于,包括:第一确定模块,用于确定待探测网页的标识;
获取模块,用于在预先存储的原始采样数据中,获取所述标识对应的原始采样数据;
第一采样模块,用于对所述待探测网页进行采样,得到当前采样数据;
判断模块,用于判断所获取的原始采样数据与所述当前采样数据是否相同;如果相同,触发第二确定模块,
第二确定模块,用于确定待探测网页未被篡改。
9.根据权利要求8所述的装置,其特征在于,所述第一确定模块,具体用于:接收用户终端发送的访问请求,将所述访问请求中携带的统一资源定位符URL确定为待探测网页的标识;
或者,每隔预设时间段,按照预设顺序依次将存储的各网页的URL确定为待探测网页的标识。
10.根据权利要求8所述的装置,其特征在于,所述获取模块,具体用于:在预先存储的原始网页数据长度中,获取所述标识对应的原始网页数据长度;
获取所述标识对应的待探测网页数据长度;
判断所获取的原始网页数据长度与所述待探测网页数据长度是否相同;
如果相同,则在预先存储的原始采样数据中,获取所述标识对应的原始采样数据。
11.根据权利要求8所述的装置,其特征在于,所述获取模块,具体用于:在预先存储的探测表项中,查找包含所述标识的探测表项;
如果查找到,读取查找到的探测表项中包含的原始采样数据;
如果未查找到,从备份服务器中获取所述标识对应的原始网页,对所述原始网页进行采样,得到原始采样数据。
12.根据权利要求8所述的装置,其特征在于,所述第一确定模块,具体用于:读取用户终端发送的访问请求中携带的URL;若所读取的URL指向动态网页,则将所读取的URL中的动态序号调整为预设序号,将调整后的URL确定为待探测URL;所述获取模块,具体用于:在预先存储的原始采样数据中,获取所述待探测URL对应的原始采样数据;
所述第一采样模块,具体用于:对所述待探测URL对应的待探测网页进行采样,得到当前采样数据。
13.根据权利要求8所述的装置,其特征在于,所述获取模块,具体用于:在预先存储的网页的标识及与所述标识对应的探测标记中,获取所述待探测网页的标识对应的探测标记;判断所获取的探测标记是否为未篡改标记;如果为未篡改标记,在预先存储的原始采样数据中,获取所述待探测网页的标识对应的原始采样数据;
所述装置还包括:
调整模块,用于在判定所获取的原始采样数据与所述当前采样数据不同的情况下,将所述待探测网页的标识对应的探测标记调整为篡改标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三信息安全技术有限公司,未经新华三信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711278421.0/,转载请声明来源钻瓜专利网。