[发明专利]展现和获取下载链接的方法及装置在审
申请号: | 201210191877.4 | 申请日: | 2012-06-11 |
公开(公告)号: | CN102760162A | 公开(公告)日: | 2012-10-31 |
发明(设计)人: | 田伟;应倩;苏雪峰;佟子健;茹立云 | 申请(专利权)人: | 北京搜狗信息服务有限公司;北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 展现 获取 下载 链接 方法 装置 | ||
1.一种获取下载链接的方法,其特征在于,包括:
依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
在当前浏览页面为下载相关页面时,依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
对所述下载链接进行分析优选,得到对应的优选下载链接;
将所述优选下载链接进行返回。
2.如权利要求1所述的方法,其特征在于,所述依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面的步骤,包括:
将所述当前浏览页面的页面信息与预存的下载站点内下载相关页面的页面信息进行匹配,若匹配成功,则判定当前浏览页面为下载相关页面;和/或
依据页面模型判别所述当前浏览页面是否为下载类别,若为下载类别,则判定当前浏览页面为下载相关页面;所述页面模型依据全网中抓取的页面元素和用户标识进行构造,用于判定当前浏览页面所属的类别。
3.如权利要求1所述的方法,其特征在于,所述依据所述下载相关页面的页面信息获取相应资源的下载链接的步骤,包括:
提取所述下载相关页面中的位置信息,并依据所述位置信息分析出对应的下载链接;和/或
根据预设的下载相关页面信息和下载链接的对应关系,由所述下载相关页面的页面信息匹配得到相应资源的下载链接。
4.如权利要求3所述的方法,其特征在于,所述提取所述下载相关页面中的位置信息,并依据所述位置信息分析出对应的下载链接的步骤,进一步包括:
所述下载相关页面含有所述下载链接时,所述依据所述页面信息进行分析,得到相应资源的下载链接在所述下载相关页面中的位置信息作为第一位置信息,并依据所述第一位置信息提取所述下载链接;
所述下载相关页面不含所述下载链接时,所述依据所述页面信息转至含有相应资源的下载链接所在的二级下载页面进行分析,得到相应资源的下载链接在所述二级下载页面中的位置信息作为第二位置信息,并依据所述第二位置信息提取所述下载链接。
5.如权利要求4所述的方法,其特征在于,所述依据所述页面信息进行分析,得到相应资源的下载链接在所述下载相关页面中的位置信息作为第一位置信息的步骤,包括:
依据所述下载相关页面的页面信息进行分析,得到所述下载相关页面的站点属性;
根据预存的各站点属性与该站点内所述下载相关页面中下载链接所对应的位置信息的关联关系,匹配得到所述下载链接在所述下载相关页面中的位置信息作为第一位置信息。
6.如权利要求4或5所述的方法,其特征在于,所述下载相关页面含有所述下载链接时,所述方法还包括:
分别提取同一下载站点内各下载相关页面中的链接和所述链接在各下载相关页面中的相对位置,并分别统计下载相关页面中的各相对位置所对应的不同链接的数目;
将在所述不同链接的数目最大时所对应的相对位置作为第一位置信息。
7.如权利要求4所述的方法,其特征在于,所述依据所述页面信息转至含有相应资源的下载链接所在的二级下载页面进行分析,得到相应资源的下载链接在所述二级下载页面中的位置信息作为第二位置信息的步骤,包括:
依据所述页面信息得到含有相应资源的下载链接所在的页面的站点属性;
根据预存的各站点属性与该站点内二级下载页面中下载链接所对应的位置信息的关联关系,匹配得到相应资源的下载链接在所述二级下载页面中的位置信息,作为第二位置信息。
8.如权利要求4或7所述的方法,其特征在于,所述下载相关页面不含所述下载链接时,所述方法还包括:
分别提取同一下载站点内各二级下载页面中的链接和所述链接在各二级下载页面中的相对位置,并分别统计二级下载页面中的各相对位置所对应的不同链接的数目;
将在所述不同链接的数目最大时所对应的相对位置作为第二位置信息。
9.如权利要求1所述的方法,其特征在于,所述对下载链接进行分析优选,得到对应的优选下载链接的步骤,进一步包括:
在所述下载链接为一个以上时,根据各下载链接的质量属性,确定各下载链接的质量;
依据下载链接的质量,从所述下载链接中选择优选的下载链接作为优选下载链接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗信息服务有限公司;北京搜狗科技发展有限公司,未经北京搜狗信息服务有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210191877.4/1.html,转载请声明来源钻瓜专利网。