[发明专利]网页检测方法及装置在审
申请号: | 201310643263.X | 申请日: | 2013-12-03 |
公开(公告)号: | CN104679798A | 公开(公告)日: | 2015-06-03 |
发明(设计)人: | 刘健 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/56 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 检测 方法 装置 | ||
1.一种网页检测方法,其特征在于,包括以下步骤:
接收到客户端触发的对某一网址的检测指令时,匹配该待检测网址的跳转关系,查找是否存储有所述待检测网址跳转后的目的网址;
若查找到所述目的网址,则查询并获取所述目的网址的页面状态;
若没有查找到所述目的网址,则查询并获取所述待检测网址的页面状态。
2.如权利要求1所述的方法,其特征在于,还包括:
将获取的所述目的网址或者待检测网址的页面状态返回至客户端。
3.如权利要求1或2所述的方法,其特征在于,所述查询并获取所述待检测网址的页面状态,包括:
查询是否存储有所述待检测网址的页面状态;
若存储有所述待检测网址的页面状态,则获取存储的所述待检测网址的页面状态;
若未存储所述待检测网址的页面状态,则探测所述待检测网址的跳转关系;根据探测结果,检测并获取所述待检测网址的页面状态。
4.如权利要求3所述的方法,其特征在于,所述根据探测结果,检测并获取所述待检测网址的页面状态,包括:
探测到所述待检测网址存在目的网址时,下载所述目的网址对应的页面内容,分析下载的所述目的网址的页面内容,获取所述目的网址的页面状态;将获取的所述目的网址的页面状态作为所述待检测网址的页面状态;
探测到所述待检测网址不存在目的网址时,下载所述待检测网址对应的页面内容,分析下载的所述待检测网址的页面内容,获取所述待检测网址的页面状态。
5.如权利要求3所述的方法,其特征在于,所述探测所述待检测网址的跳转关系,包括:
下载所述待检测网址的http头,根据所述http头中的信息,识别所述待检测网址是否有跳转后的目的网址。
6.如权利要求3所述的方法,其特征在于,所述根据探测结果,检测并获取所述待检测网址的页面状态,之后还包括:
存储检测出的所述待检测网址的页面状态,同时存储所述待检测网址跳转后的目的网址与所述待检测网址的跳转关系。
7.一种网页检测装置,其特征在于,包括:
匹配模块,用于接收到客户端触发的对某一网址的检测指令时,匹配该待检测网址的跳转关系,查找是否存储有所述待检测网址跳转后的目的网址;
查询模块,用于在查找到所述目的网址时,查询并获取所述目的网址的页面状态;在没有查找到所述目的网址时,查询并获取所述待检测网址的页面状态。
8.如权利要求7所述的装置,其特征在于,还包括:
反馈模块,用于将获取的所述目的网址或者待检测网址的页面状态返回至客户端。
9.如权利要求7或8所述的装置,其特征在于,所述查询模块还用于:
查询是否存储有所述待检测网址的页面状态;
若存储有所述待检测网址的页面状态,则获取存储的所述待检测网址的页面状态;
若未存储所述待检测网址的页面状态,则探测所述待检测网址的跳转关系;根据探测结果,检测并获取所述待检测网址的页面状态。
10.如权利要求9所述的装置,其特征在于,所述查询模块还用于:
探测到所述待检测网址存在目的网址时,下载所述目的网址对应的页面内容,分析下载的所述目的网址的页面内容,获取所述目的网址的页面状态;将获取的所述目的网址的页面状态作为所述待检测网址的页面状态;
探测到所述待检测网址不存在目的网址时,下载所述待检测网址对应的页面内容,分析下载的所述待检测网址的页面内容,获取所述待检测网址的页面状态。
11.如权利要求9所述的装置,其特征在于,所述查询模块还用于:
下载所述待检测网址的http头,根据所述http头中的信息,识别所述待检测网址是否有跳转后的目的网址。
12.如权利要求9所述的装置,其特征在于,还包括:
存储模块,用于存储检测出的所述待检测网址的页面状态,同时存储所述待检测网址跳转后的目的网址与所述待检测网址的跳转关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;,未经腾讯科技(深圳)有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310643263.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据访问处理方法和装置
- 下一篇:一种网络搜索方法和装置