[发明专利]网站类型识别系统有效
申请号: | 201210430060.8 | 申请日: | 2012-10-31 |
公开(公告)号: | CN102932452A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 魏冬 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网站 类型 识别 系统 | ||
技术领域
背景技术
随着手机上网的普及,WAP(无线应用协议)概念越来越多地被人们所熟悉,手机能够访问的WAP站点和服务越来越多。
目前WAP站点分为两种,WAP1.X和WAP2.0。
WAP1.0标准,在1998年4月公布,WAP1.1在1999年发布,WAP1.2是WAP1.X的最后一个更新,在2000年6月公布。WAP1.X规定无线设备访问的页面是用WML(XML语言的一种)语言编写的,但是WAP2.0将XHTML-MP做为主要内容格式。
WAP 2.0协议在2002年发布,是重新设计的WAP,使用了端到端HTTP的精简XHTML版本,去除了网关和用于通信的Custom Protocol Suite,并支持CSS,使得网页具有更丰富的版面呈现。
WAP1.X与WAP2.0是完全不同,不可能兼容的。目前大多数WAP站点都采用了最新的WAP2.0技术,但是仍有相当一部分WAP1.X的站点存在。手机浏览器在显示WAP1.X和WAP2.0时需采用不同的解析技术。如果使用WAP2.0的解析器去解析WAP1.X的网页,就会导致无法显示网页。
随着网络技术的发展,以后也还会出现WAP3.0,4.0甚至说不限于WAP格式,使用其他编程语言的站点技术,其不同版本,不同类型的网站的共存的情况,也都会出现对不同类型、不同版本的网站无法正确解析、识别的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网站类型识别系统。
本发明提供一种网站类型识别系统,其包括服务器、客户端以及白名单存储器,其中,
所述服务器包括:请求接收接口和分析器;
所述请求接收接口,适于接收来自客户端的网页请求;
所述分析器,适于根据所述网页请求和白名单存储器中存储的第一类型的网站名单,分析所述客户端请求的网页的类型,并根据分析结果通知所述客户端采用相应的解析引擎对所述客户端请求的网页进行解析;
所述客户端包括请求发送接口、消息接收接口、控制器、第一解析器和第二解析器,其中,
所述请求发送接口,适于向服务器发送网页请求;
所述消息接收接口,适于接收服务器返回的通知消息,以及接收服务器返回的网页;
所述控制器,适于根据所述服务器的通知消息控制所述第一解析器或者第二解析器对所述服务器返回的网页进行解析,以及在所述第二解析器对所述服务器返回的网页解析失败的情况下,通知白名单存储器添加所述网页请求对应的URL,并控制所述第一解析器对所述服务器返回的网页进行解析;
所述第一解析器,适于采用解析第一类型网页的第一解析引擎;
所述第二解析器,适于采用解析第二类型网页的第二解析引擎;
所述白名单存储器包括名单数据库、输入输出接口和更新单元,其中,
所述名单数据库,适于存储所述第一类型的网站名单;
所述输入输出接口,适于接收所述服务器或者所述客户端发来的读取请求或更新通知,将所请求的数据返回给所述服务器或客户端;
所述更新单元,适于根据所述更新通知,更新所述第一类型的网站名单。
可选地,所述服务器还包括:白名单更新器;
所述白名单更新器,适于根据所述分析结果更新所述白名单存储器。
可选地,所述分析器进一步包括:白名单读取器和URL比较器;
所述白名单读取器,适于读取所述白名单存储器中的第一类型的网站名单;
所述URL比较器,适于将所述网页请求对应的URL与所述第一类型的网站名单中的第一类型的网站进行比较,以判断所述网页请求对应的URL是否属于所述第一类型的网站名单,如果是,通知所述客户端采用第一解析引擎对所述客户端请求的网页进行解析。
可选地,所述服务器还包括:页面判断单元;
所述页面判断单元,适于在所述网页请求对应的URL不属于所述第一类型的网站名单时,判断所述网页请求中是否包含第一子类型的网站的特征码,如果是,通知所述白名单更新器将所述网页请求对应的URL放入所述第一类型的网站名单,并通知所述客户端采用第一解析引擎对所述客户端请求的网页进行解析;否则,通知所述客户端采用第二解析引擎对所述客户端请求的网页进行解析;
其中,所述第一子类型的网站是所述第一类型的网站中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210430060.8/2.html,转载请声明来源钻瓜专利网。