[发明专利]页面改版的监控方法及相关系统有效
申请号: | 201810679788.1 | 申请日: | 2018-06-27 |
公开(公告)号: | CN110717131B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 袁园 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F8/41 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 改版 监控 方法 相关 系统 | ||
本发明公开了一种页面改版的监控方法及相关系统,其中,页面改版的监控方法,包括:获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;根据所述解析模板标识对所述异常字段信息进行聚类统计,得到每个解析模板对应的异常解析数;判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值;如果是,则判断所述解析模板对应的页面发生改版。
技术领域
本发明涉及计算机软件技术领域,尤其涉及一种页面改版的监控方法及相关系统。
背景技术
目前,各个网站根据栏目的不同,会设置有多种不同的页面。因此,针对每一种页面,需要依据页面的特点配置对应的解析模板,用以对页面进行解析。
在利用解析模板解析页面的实际应用过程中,若页面改版,采用原有的解析模板进行解析会出现解析失败的问题。因此,在页面的解析过程中还需要识别每一个页面是否进行了改版。
目前页面的改版的识别主要是通过人工统计数据的方式。由人工统计页面解析后的数据,判断数据是否有缺失,处理效率低且准确性差。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的页面改版的监控方法及相关系统。
一种页面改版的监控方法,包括:
获取至少一个页面对应的页面解析结果,所述页面解析结果通过解析模板对所述页面解析后得到;其中,所述页面解析结果包括未解析出的异常字段信息以及所述异常字段信息对应的解析模板标识;
根据所述解析模板标识对所述异常字段信息进行聚类统计,得到每个解析模板对应的异常解析数;
判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值;
如果是,则判断所述解析模板对应的页面发生改版。
可选地,在判断所述解析模板对应的页面发生改版后,所述方法还包括以下至少一项:
停止采用发生改版的页面对应的解析模板进行页面解析;
将发生改版的页面对应的解析模板的状态设置为不可用状态;
在检测到发生改版的页面对应的解析模板发生更新后,将更新后的解析模板的状态设置为可用状态。
可选地,所述判断每个解析模板对应的异常解析数是否超过对应的预设异常阈值之后,所述方法还包括:
根据每个解析模板对应的异常解析数的判断结果,生成异常解析日志,其中,所述异常解析日志中包括以下信息中的至少一项:超过对应的预设异常阈值的解析模板的解析模板标识、页面URL和解析模板创建者信息,所述信息以列表的形式记录在所述异常解析日志中;
将所述异常解析日志保存至数据库;和/或
向预设地址发送所述异常解析日志。
可选地,所述方法还包括以下至少一项:
所述页面解析结果的存储形式为日志;
所述异常字段信息包括空值或预设错误标识;
当所述解析模板为多个时,每个所述解析模板对应的预设异常阈值相同,或者,多个所述解析模板对应的预设异常阈值中至少存在两个以上不同。
可选地,在获取至少一个页面对应的页面解析结果之前,所述方法还包括:获取每个待解析页面对应的解析模板;
采用所述解析模板对所述待解析页面进行解析,得到所述页面解析结果。
一种页面解析装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810679788.1/2.html,转载请声明来源钻瓜专利网。