[发明专利]一种链接检测方法及装置在审
申请号: | 202111148717.7 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113590987A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 尹彬强;孙成新;王金明 | 申请(专利权)人: | 飞狐信息技术(天津)有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧慧 |
地址: | 300280 天津市滨海新区经济技术开发区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 链接 检测 方法 装置 | ||
本发明提供一种链接检测方法及装置,该方法为:获取预设的网址列表,网址列表中包含至少一个待检测网址;提取待检测网址中的超链接并据此构建相应的超链接列表;访问超链接列表中的各个超链接,并获取各个超链接的响应结果;根据各个超链接的响应结果,确定包含超链接列表中的无效链接的最终死链列表。本方案中,获取预先构建的包含待检测网址的网址列表,提取待检测网址中的超链接并构建超链接列表。访问超链接列表中的各个超链接得到对应的响应结果,根据所得到的响应结果确定最终死链列表,最终死链列表中包含超链接列表中的无效链接。不需要由检测人员一一点击链接来确定无效链接,降低检测死链的时间和提高检测死链的准确率。
技术领域
本发明涉及链接分析技术领域,尤其涉及一种链接检测方法及装置。
背景技术
目前通过动态页面展示信息时,主要是利用动态页面中的链接从服务器获取数据,并将所获取的数据渲染到动态页面中以完成信息展示。为保证动态页面能正常展示信息,需检测动态页面中失效或错误的链接(也称为死链)并对其进行处理。
现有检测死链的方式为:由检测人员一一点击动态页面中的链接来进行人工检测,但是,由于动态页面的数量较多且动态页面中也包含了大量的链接,检测人员需要耗费大量的时间去检测死链,检测时间较长,并且检测人员在检测死链的过程中容易出现纰漏,检测准确率较低。
发明内容
有鉴于此,本发明实施例提供一种链接检测方法及装置,以解决现有检测死链的方式存在的检测时间长和检测准确率低等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种链接检测方法,所述方法包括:
获取预设的网址列表,所述网址列表中包含至少一个待检测网址;
提取所述待检测网址中的超链接并据此构建相应的超链接列表;
访问所述超链接列表中的各个所述超链接,并获取各个所述超链接的响应结果;
根据各个所述超链接的响应结果,确定包含所述超链接列表中的无效链接的最终死链列表。
优选的,所述根据各个所述超链接的响应结果,确定包含所述超链接列表中的无效链接的最终死链列表,包括:
针对每个所述超链接,若所述超链接的响应结果符合预设的死链判断条件,确定所述超链接为无效链接,所述死链判断条件基于指示超链接为无效链接的响应状态、响应内容和响应访问的时间设置得到;
利用所确定的所有所述无效链接,确定最终死链列表。
优选的,所述利用所确定的所有所述无效链接,确定最终死链列表,包括:
利用所确定的所有所述无效链接,确定初检死链列表;
访问所述初检死链列表中的各个所述无效链接并获取相应的响应结果;
从所述初检死链列表中剔除响应结果不符合所述死链判断条件的所述无效链接,返回执行访问所述初检死链列表中的各个所述无效链接并获取相应的响应结果这一步骤,直至执行次数等于预设次数,确定剔除响应结果不符合所述死链判断条件的所述无效链接后的所述初检死链列表为最终死链列表。
优选的,针对每个所述超链接,若所述超链接的响应结果符合预设的死链判断条件,确定所述超链接为无效链接,包括:
针对每个所述超链接,解析所述超链接的响应结果得到对应的响应状态、响应内容和响应访问的时间;
针对每个所述超链接,若所述超链接的响应状态不满足预设响应状态,或者,若所述超链接响应访问的时间大于预设时间,或者,若所述超链接的响应内容为预设响应内容,确定所述超链接为无效链接。
优选的,所述提取所述待检测网址中的超链接并据此构建相应的超链接列表,包括:
根据所述待检测网址获取相应的页面代码;
从所述待检测网址对应的页面代码中提取超链接并据此构建超链接列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞狐信息技术(天津)有限公司,未经飞狐信息技术(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111148717.7/2.html,转载请声明来源钻瓜专利网。