[发明专利]网站类型识别系统有效
申请号: | 201210430060.8 | 申请日: | 2012-10-31 |
公开(公告)号: | CN102932452A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 魏冬 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种网站类型识别系统,涉及互联网领域。所述系统包括服务器、客户端和白名单存储器,其中,所述服务器包括:请求接收接口和分析器;所述客户端包括请求发送接口、消息接收接口、控制器、第一解析器和第二解析器;所述白名单存储器包括名单数据库、输入输出接口和更新单元。所述网站类型识别系统通过在白名单存储器中动态维护一个第一类型的网站名单,供服务器调用后判断客户端请求网页的类型,进而通知客户端采用相应的解析引擎对其所请求的网页进行解析,解决了客户端对不同类型、不同版本的网站无法正确解析、识别的问题,提高了解析效率和准确度。 | ||
搜索关键词: | 网站 类型 识别 系统 | ||
【主权项】:
一种网站类型识别系统,其包括服务器、客户端和白名单存储器,其中,所述服务器包括:请求接收接口和分析器;所述请求接收接口,适于接收来自客户端的网页请求;所述分析器,适于根据所述网页请求和白名单存储器中存储的第一类型的网站名单,分析所述客户端请求的网页的类型,并根据分析结果通知所述客户端采用相应的解析引擎对所述客户端请求的网页进行解析;所述客户端包括请求发送接口、消息接收接口、控制器、第一解析器和第二解析器,其中,所述请求发送接口,适于向服务器发送网页请求;所述消息接收接口,适于接收服务器返回的通知消息,以及接收服务器返回的网页;所述控制器,适于根据所述服务器的通知消息控制所述第一解析器或者第二解析器对所述服务器返回的网页进行解析,以及在所述第二解析器对所述服务器返回的网页解析失败的情况下,通知白名单存储器添加所述网页请求对应的URL,并控制所述第一解析器对所述服务器返回的网页进行解析;所述第一解析器,适于采用解析第一类型网页的第一解析引擎;所述第二解析器,适于采用解析第二类型网页的第二解析引擎;所述白名单存储器包括名单数据库、输入输出接口和更新单元,其中,所述名单数据库,适于存储所述第一类型的网站名单;所述输入输出接口,适于接收所述服务器或者所述客户端发来的读取请求或更新通知,将所请求的数据返回给所述服务器或客户端;所述更新单元,适于根据所述更新通知,更新所述第一类型的网 站名单。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210430060.8/,转载请声明来源钻瓜专利网。