[发明专利]基于云端的网站首页结构监测方法有效

专利信息
申请号: 202110059739.X 申请日: 2021-01-18
公开(公告)号: CN112765601B 公开(公告)日: 2023-04-18
发明(设计)人: 李传咏;卢颖;赵莉;陈宁;张亮 申请(专利权)人: 西安博达软件股份有限公司
主分类号: G06F21/55 分类号: G06F21/55;G06F16/958
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 王营超
地址: 710077 陕西省西安市高*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 云端 网站 首页 结构 监测 方法
【说明书】:

发明公开了一种基于云端的网站首页结构监测方法,S1、添加域名:确定要监测的网站和网站域名;S2、进行采集:间隔预设的时间访问一次S1中的网站首页;S3、进行保存:首页网页源代码中的文字、IMG标签的src属性、A标签的href属性、SCRIPT标签中的src属性过滤掉只保留标签;S4、进行计算:检查S3样本采集记录中是否存在当前网站首页的记录;S5、进行判断:通过计算相似度。本发明完善了网站监测的检测指标,提高监测的时效性,当网站首页发生形变或篡改时,快速通知网站管理员,快速发现问题,解决问题,同时,提升网站使用者的用户体验和网站的权威性,节约人工监测的成本。

技术领域

本发明涉及网站监测技术领域,尤其涉及基于云端的网站首页结构监测方法。

背景技术

网站监测系统一般都会采用爬虫技术,爬取网站信息,判断网站首页是否能访问,首页内容的更新时间是否及时,首页上的链接是否可用,首页内容是否包含敏感信息。如果检测到上述项内容时给网站管理员发送消息进行预警,现有的网站监测系统只能监测首页面是否能连通,首页内容是否更新及时,首页上的链接是否可用,以及首页是否包含敏感信息等。无法监测首页是否发生形变,是否被篡改。出现类似问题时,只能通过人工发现,缺乏时效性,现有监测系统不能完全满足网站监测的真实需求。

同时,对页面是否发生形变,页面是否被篡改则无法感知和监测。当页面发生形变或被篡改时,现有的网站监测系统监测不到,只有人工访问网站的时候才能发现。对政府、高校、企业来说页面的连通性和内容安全只是最基本的保障,页面的有效可用才是最关键的,要保证为网友提供持续服务和良好的用户体验。因此,如何提供一种基于云端的网站首页结构监测方法是本领域技术人员亟需解决的问题。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出基于云端的网站首页结构监测方法,本发明完善了网站监测的检测指标,提高监测的时效性,当网站首页发生形变或篡改时,快速通知网站管理员,快速发现问题,解决问题,同时,提升网站使用者的用户体验和网站的权威性,节约人工监测的成本。

根据本发明实施例的一种基于云端的网站首页结构监测方法,包括如下方法步骤:

S1、添加域名:确定要监测的网站和网站域名;

S2、进行采集:间隔预设的时间访问一次S1中的网站首页,使用HttpClient请求S1中的网页域名,保存首页网页源代码;

S3、进行保存:将S2中保存的首页网页源代码中的文字、IMG标签的src属性、A标签的href属性、SCRIPT标签中的src属性过滤掉只保留标签,从而生成首页标签代码文件,整个生成文件的过程称为一次数据样本采集;

S4、进行计算:检查S3样本采集记录中是否存在当前网站首页的记录;

如果不存在,则记为第一次采集,将采集下来的首页图片、首页网页代码、首页标签代码分别存储在首页标签代码历史目录、首页网页源代码历史目录下,然后记录样本采集记录;

如果存在,则将采集下来的首页标签代码、首页网页源代码与对应历史文件进行相似度计算;

S5、进行判断:通过计算相似度:

如果首页标签代码相似度大于预设的值A且首页网页代码相似度大于预设的值B,说明网站首页结构未发生改变,保存本次集采的文件至对应的目录,本次检测结束;

否则,则说明网站首页结构存在变化的风险,则给对应的网站管理员发送消息进行确认。

优选的,所述首页标签代码相似度计算方法如下:

S411、以本次采集的首页标签代码中的标签N[i]和上一次采集的首页标签代码中的标签O[j]为两个维度生成二维矩阵L,其中记N的长度为m,O的长度为n;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安博达软件股份有限公司,未经西安博达软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110059739.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top