[发明专利]一种非合作环境下的资源选择方法有效
申请号: | 201210035195.4 | 申请日: | 2012-02-16 |
公开(公告)号: | CN102609536A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 任祖杰;徐向华;万健;张纪林;蒋从锋;任永坚 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合作 环境 资源 选择 方法 | ||
1.一种非合作环境下的资源选择方法,其特征在于:在资源选择时兼顾资源相关度和重叠程度,从而提高查询的效率,该方法采用以下步骤实现:
步骤1:首先利用基于相关度的资源选择方法,计算出每个资源相关度并排序,得到一个依据资源相关度排序的资源列表;
步骤2:从查询结果中获取结果文档的指纹集;假定一个资源组<P1,P2…Pi…Pn>,并假定一个节点产生一个查询Q,当节点收到返回结果后,对每个结果文档,利用指纹提取技术提取出一串固定长度的数字来表示一个结果文档的标题内容;
步骤3:管理覆盖统计信息;这个过程包含了三个子过程:从结果指纹集中提取覆盖统计信息的过程、覆盖统计信息的存储过程、覆盖统计信息检索的过程;所述的管理包含两类操作:存储和检索;当一组覆盖统计信息产生后,系统需要根据覆盖统计信息中查询的语义,分发到系统的各个资源中进行存储,方便覆盖统计信息的检索;
步骤4:计算每个资源的新颖度;根据给定一组资源及其覆盖统计信息,计算出每个资源含新颖结果的数量,进而计算出每个资源对查询结果的新颖度;
步骤5:根据步骤1中计算得出的资源相关度,结合新颖度对资源排序的列表进行调整,使得新颖结果数量最大化。
2.根据权利1所述的一种非合作环境下的资源选择方法,其特征在于:在步骤2中,当节点收到返回结果后,对每个结果的标题内容进行提取指纹,即用一串固定长度的数字来代表一个结果文档,从而使每个资源返回的结果对应一个指纹集合;然后,利用布隆过滤器来进一步压缩该指纹集合,从而得到每个资源Pi关于查询Q的结果指纹集。
3.根据权利1所述的一种非合作环境下的资源选择方法,其特征在于:在步骤3中,从步骤2中获取的指纹集中提取覆盖统计信息,然后将覆盖统计信息分发到各个资源进行存储,分发过程采用基于查询关键词语义的策略,将相似语义的查询对应覆盖统计信息聚为同一个类并存储在同一个资源上;相应地,给定一个查询,该查询相关的覆盖统计信息通过该查询的语义向量进行检索,快速找到存储该查询相关覆盖统计信息的资源,减小系统的存储开销和提高系统的可扩展性。
4.根据权利1所述的一种非合作环境下的资源选择方法,其特征在于:步骤4中计算资源新颖度的过程中,布隆过滤器形成查询Q的覆盖统计信息之后,通过比较布隆过滤器之间的重叠程度,计算出相应的指纹集的重叠度,最后计算得到每个资源的新颖度。
5.根据权利1所述的一种非合作环境下的资源选择方法,其特征在于:在步骤5中,利用已经得到的一个按相关度排序的资源列表,计算每个资源的新颖度,对每个资源相关度和新颖度进行加权运算,得到最优资源列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210035195.4/1.html,转载请声明来源钻瓜专利网。