[发明专利]一种基于网页对比的网页篡改监控方法及系统在审
申请号: | 201810287818.4 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108804498A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 杜康华;任文越;王崇 | 申请(专利权)人: | 微梦创科网络科技(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 任漱晨 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网址 数据信息 网页篡改 网址链接 网页 历史数据信息 监控 爬虫 监控操作 篡改 报警信息 监控结果 数据量 保存 返回 更新 | ||
1.一种基于网页对比的网页篡改监控方法,其特征在于,包括:
获取各待监控的网址链接;
针对每一待监控的网址链接,分别执行如下网页篡改监控操作:
对所述网址链接对应的网址进行一次爬虫操作,得到所述网址的当前数据信息;
根据所述网址的历史数据信息和当前数据信息,判断对应的网页是否发生篡改;
当确定对应的网页发生篡改时,则发出报警信息;否则,更新所述网址的历史数据信息,并返回继续对所述网址链接执行网页篡改监控操作。
2.根据权利要求1所述的基于网页对比的网页篡改监控方法,其特征在于,所述数据信息包括对应待监控的网址链接的网址的截图、网址跳转的次数、网址跳转的最终地址及网址的名称。
3.根据权利要求2所述的基于网页对比的网页篡改监控方法,其特征在于,所述根据所述网址的历史数据信息和当前数据信息,判断对应的网页是否发生篡改,具体包括:
根据所述网址的历史数据信息和当前数据信息,分别对网址的名称、网址跳转的次数、网址跳转的最终地址、网址的截图进行校验,得到名称校验结果、次数校验结果、地址校验结果及截图校验结果;
根据所述名称校验结果、次数校验结果、地址校验结果及截图校验结果及各校验结果分别对应的权值,确定总校验值;
将总校验值与预设的篡改阈值进行比较,确定对应的网页是否发生篡改:
如果总校验值大于或等于篡改阈值,则确定对应的网页发生篡改;否则,确定对应的网页没有发生篡改。
4.根据权利要求3所述的基于网页对比的网页篡改监控方法,其特征在于,所述根据所述网址的历史数据信息和当前数据信息,分别对网址的名称、网址跳转的次数、网址跳转的最终地址、网址的截图进行校验,得到名称校验结果、次数校验结果、地址校验结果及截图校验结果,具体包括:
根据以下公式,对网址的名称进行字符串校验,确定名称校验结果:
其中,i表示待监控的网址链接的序号,n表示待监控的网址链接的数量,Nsrc(i)表示网址的历史名称字符串,Ncapture(i)表示网址的当前名称字符串,D1(i)表示名称校验结果;
根据以下公式,对网址跳转的次数进行校验,确定次数校验结果:
其中,|Tsrc(i)|表示网址的历史跳转次数,|Tcapture(i)|表示网址的当前跳转次数,D2(i)表示次数校验结果;
根据以下公式,对网址跳转的最终地址进行校验,得到地址校验结果:
其中,表示网址跳转的历史最终地址,表示网址跳转的当前最终地址,D3(i)表示地址校验结果;
根据以下步骤,对网址的截图进行校验,得到截图校验结果:
分别将网址的历史截图和当前截图压缩成(k+1)*k大小的图片:
其中,0<k<n-1,resize(·)表示图像压缩函数,Isrc(i)表示压缩前的网址的历史截图,表示压缩后的网址的历史截图,Icapture(i)表示压缩前的网址的当前截图,表示压缩后的网址的当前截图;
根据以下公式对压缩后的历史截图进行差异计算,得到历史差异矩阵
根据以下公式对压缩后的当前截图进行差异计算,得到当前差异矩阵
根据历史差异矩阵及当前差异矩阵确定差异矩阵Idif:
统计差异矩阵Idif中非0的个数d;
将非0个数d与预设的个数阈值进行比较,确定截图校验结果D4(i):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微梦创科网络科技(中国)有限公司,未经微梦创科网络科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810287818.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于日志的大数据分析方法
- 下一篇:一种检测有效信息的方法及装置