[发明专利]一种非合作环境下的资源选择方法有效
申请号: | 201210035195.4 | 申请日: | 2012-02-16 |
公开(公告)号: | CN102609536A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 任祖杰;徐向华;万健;张纪林;蒋从锋;任永坚 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合作 环境 资源 选择 方法 | ||
技术领域
本发明涉及一种非合作环境下的资源选择方法,更具体的说,本发明涉及一种兼顾资源相关度和重叠程度的、非合作环境下的资源选择方法。
背景技术
资源选择是分布式信息检索领域的一个热门研究主题。对于给定一个查询Q,分布式搜索引擎利用资源选择方法确定与该查询最相关资源列表,然后将查询发给最相关资源列表中的资源。优秀的资源选择方法能够使得对每个查询,只需要少量资源参与查询就可以达到和全部资源参与查询接近的结果。因此,资源选择的效果直接决定了查询执行过程的效率和查询结果的质量。
大部分传统的资源选择方法关注于资源与查询的相关度。这些方法通常假定各个资源的文档集不存在重叠,或者认为重叠较小以致可以忽略不计。然而,在一个非合作性环境下的P2P搜索引擎中,各个资源独立维护其文档集,不可避免地使得非合作性环境下的资源之间会有相当数量相同或者非常相似的文档。例如,著名的电子图书馆如ACM、IEEE之间存在很多相似的论文,新闻类网站如网易、新浪等,也会包含大量的相似的新闻网页。
面对这种问题,如果资源选择方法不考虑资源文档集的重叠,就可能将一个查询转发给两个重叠程度很高的资源(如两个镜像站点),造成网络资源浪费并降低查询的效率。因此,有必要研究一种兼顾资源重叠和相关度的资源选择方法。
发明内容
针对上述问题,本发明公开了一种非合作环境下的资源选择方法,该方法在选择资源时能够同时兼顾资源重叠度和相关度,最大化预期新颖结果总量,改进资源选择的有效性,从而提高查询的效率。
本发明解决其技术问题采用的技术方案步骤如下:
一种非合作环境下的资源选择方法,是在资源选择时兼顾资源相关度和重叠程度,从而提高查询的效率,该方法采用以下步骤实现:
步骤1:首先利用基于相关度的资源选择方法,计算出每个资源相关度并排序,得到一个依据资源相关度排序的资源列表。
步骤2:从查询结果中获取结果文档的指纹集;假定一个资源组<P1,P2…Pi…Pn>,并假定一个节点产生一个查询Q,当节点收到返回结果后,对每个结果文档,利用指纹提取技术提取出一串固定长度的数字来表示一个结果文档的标题内容。
步骤3:管理覆盖统计信息;这个过程包含了三个子过程:从结果指纹集中提取覆盖统计信息的过程、覆盖统计信息的存储过程、覆盖统计信息检索的过程;所述的管理包含两类操作:存储和检索;当一组覆盖统计信息产生后,系统需要根据覆盖统计信息中查询的语义,分发到系统的各个资源中进行存储,方便覆盖统计信息的检索。
步骤4:计算每个资源的新颖度;根据给定一组资源及其覆盖统计信息,计算出每个资源含新颖结果的数量,进而计算出每个资源对查询结果的新颖度。
步骤5:根据步骤1中计算得出的资源相关度,结合新颖度对资源排序的列表进行调整,使得新颖结果数量最大化。
本发明的有益效果:
1.本发明能够从查询结果中提取覆盖统计信息,这些覆盖统计信息在后续的查询过程中能够用于计算资源间的重叠程度,在资源选择时最大化预期的新颖结果总量,从而改进资源选择的有效性。
2.本发明将覆盖统计信息依其查询的语义向量空间存储到Chord网络中,从而使得相似语义查询集,能够共享覆盖统计信息,极大地减小系统覆盖统计信息的存储空间,并增大了覆盖统计信息的命中率,解决多词同义的问题。
3.在资源间存在重叠的情况下,本发明相比于其他资源选择方法,能够减小查询消息的浪费,有效地提高查询效率。
附图说明
图1为本发明在非合作环境下执行资源选择方法的步骤。
具体实施方式
下面结合附图,对本发明的具体实施方案作进一步详细描述。其具体步骤描述如图1所示:
步骤1.生成初始资源列表。利用基于相关度的资源选择方法,计算出每个资源的相关度并排序,得到一个依据相关度排序的列表。
步骤2. 从查询结果中获取结果文档的指纹集。包括两个子步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210035195.4/2.html,转载请声明来源钻瓜专利网。