[发明专利]页面改版的监控方法及相关系统有效
申请号: | 201810679788.1 | 申请日: | 2018-06-27 |
公开(公告)号: | CN110717131B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 袁园 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F8/41 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 改版 监控 方法 相关 系统 | ||
1.一种页面改版的监控方法,其特征在于,包括:
获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;所述解析模板为针对一个网站的每一个栏目的网页对应配置的,所述解析模板包括解析页面的规则;
根据所述解析模板标识对所述异常字段信息进行聚类统计,以解析模板标识为聚类因子,将对应同一个解析模板标识的异常字段信息作为同一类,计算每个解析模板的异常字段信息的数据,得到每个解析模板对应的异常解析数;
判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值;
如果是,则判断所述解析模板对应的页面发生改版。
2.根据权利要求1所述的方法,其特征在于,在判断所述解析模板对应的页面发生改版后,所述方法还包括以下至少一项:
停止采用发生改版的页面对应的解析模板进行页面解析;
将发生改版的页面对应的解析模板的状态设置为不可用状态;
在检测到发生改版的页面对应的解析模板发生更新后,将更新后的解析模板的状态设置为可用状态。
3.根据权利要求1所述的方法,其特征在于,所述判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值之后,所述方法还包括:
根据每个解析模板对应的异常解析数的判断结果,生成异常解析日志,其中,所述异常解析日志中包括以下信息中的至少一项:超过对应的预设异常阈值的解析模板的解析模板标识、页面URL和解析模板创建者信息,所述信息以列表的形式记录在所述异常解析日志中;
将所述异常解析日志保存至数据库;和/或
向预设地址发送所述异常解析日志。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括以下至少一项:
所述页面解析结果的存储形式为日志;
所述异常字段信息包括空值或预设错误标识;
当所述解析模板为多个时,每个所述解析模板对应的预设异常阈值相同,或者,多个所述解析模板对应的预设异常阈值中至少存在两个以上不同。
5.根据权利要求1所述的方法,其特征在于,在获取至少一个页面对应的页面解析结果之前,所述方法还包括:
获取每个待解析页面对应的解析模板;
采用所述解析模板对所述待解析页面进行解析,得到所述页面解析结果。
6.一种页面改版的监控装置,其特征在于,包括:
获取单元,用于获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;所述解析模板为针对一个网站的每一个栏目的网页对应配置的,所述解析模板包括解析页面的规则;
聚类单元,用于根据所述解析模板标识对所述异常字段信息进行聚类统计,以解析模板标识为聚类因子,将对应同一个解析模板标识的异常字段信息作为同一类,计算每个解析模板的异常字段信息的数据,得到每个解析模板对应的异常解析数;
第一判断单元,用于判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值;
第二判断单元,用于第一判断单元判断出每个解析模板对应的异常解析数超过对应的预设异常阈值,则判断所述解析模板对应的页面发生改版。
7.根据权利要求6所述的装置,其特征在于,还包括以下单元中的至少一个:
停止单元,用于停止采用发生改版的页面对应的解析模板进行页面解析;
第一设置单元,用于将发生改版的页面对应的解析模板的状态设置为不可用状态;
第二设置单元,用于在检测到发生改版的页面对应的解析模板发生更新后,将更新后的解析模板的状态设置为可用状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810679788.1/1.html,转载请声明来源钻瓜专利网。