[发明专利]由动态网页上获取链接信息的方法及其服务器有效
申请号: | 201010255706.4 | 申请日: | 2010-08-17 |
公开(公告)号: | CN101916283A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 孙宁军 | 申请(专利权)人: | 奇诺光瑞电子(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 朱晓江;周正雄 |
地址: | 518105 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 网页 获取 链接 信息 方法 及其 服务器 | ||
1.一种由动态网页上获取链接信息的方法,包括与动态网页连接的服务器,其特征在于,还包括如下步骤:
A)所述服务器按照设定自动访问所述动态网页,取得所述动态网页上的参数;
B)使用所述取得参数,生成模拟HTTP请求并发送到所述动态网页;
C)取出所述动态网页回应所述请求中的链接信息。
2.根据权利要求1所述的方法,其特征在于,所述步骤A)进一步包括如下步骤:
A1)所述服务器按照设定时间自动连接所述动态网页;
A2)所述服务器取出所述动态网页上当前参数。
3.根据权利要求2所述的方法,其特征在于,所述步骤A2)中通过分析所述动态网页的HTML文件脚本中各检索参数项来获得所述参数。
4.根据权利要求3所述的方法,其特征在于,所述步骤B)进一步包括如下步骤:
B1)对所述取得的参数进行预处理,得到检索表达式;
B2)对照所述动态网页的HTML脚本或引用的文件脚本,清理所述检索参数项与所述检索表达式的转换关系,修正所述检索表达式;
B3)依据所述检索表达式生成HTTP请求,并发送到所述动态网页。
5.根据权利要求1-4任意一项所述的方法,其特征在于,还包括如下步骤:
D)转换所述取得的链接信息的数据格式为适于在动态信息浏览界面中显示的格式并存储。
6.一种由动态网页上获取链接信息的服务器,其特征在于,所述服务器包括:
网页参数取得单元:用于按照设定自动访问所述动态网页,取得所述动态网页上的参数;
请求形成单元:用于依据所述取得参数,生成模拟HTTP请求并发送到所述动态网页;
链接信息取得单元:用于由所述动态网页对于所述请求的回应中取出其上内容的链接信息。
7.根据权利要求6所述的服务器,其特征在于,所述网页参数取得单元进一步包括:
自动连接子单元:用于按照设定的时间使得所述服务器与所述动态网页自动连接;
当前参数取得子单元:用于取得所述动态网页页面上的参数。
8.根据权利要求7所述的服务器,其特征在于,所述当前参数取得子单元包括将所述动态网页的HTML文件脚本取出,并取得所述脚本中检索参数的检索参数项分析模块。
9.根据权利要求8所述的服务器,其特征在于,所述请求形成单元进一步包括:
预处理子单元:用于对所述HTML文件脚本中的检索参数项进行预处理,形成检索表达式;
检索表达式修正子单元:用于结合所述动态网页的HTML脚本或引用的文件脚本,对所述检索表达式进行修正;
HTTP请求形成子单元:用于使用所述修正后的检索表达式,形成发送到所述动态网页的HTTP请求。
10.根据权利要求9所述的服务器,其特征在于,所述服务器还包括将所述得到的动态网页上的链接信息转换为适于在动态浏览界面上显示的数据格式的链接信息格式转换单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇诺光瑞电子(深圳)有限公司,未经奇诺光瑞电子(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010255706.4/1.html,转载请声明来源钻瓜专利网。