[发明专利]一种基于P2P网络实现全文检索系统的方法无效

专利信息
申请号: 200810061395.0 申请日: 2008-04-25
公开(公告)号: CN101272399A 公开(公告)日: 2008-09-24
发明(设计)人: 胡天磊;陈刚;陈珂;寿黎但;任祖杰 申请(专利权)人: 浙江大学
主分类号: H04L29/08 分类号: H04L29/08;G06F17/30
代理公司: 杭州求是专利事务所有限公司 代理人: 周烽
地址: 310027浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于P2P网络实现全文检索系统的方法。本方法首先将所有普通节点根据各自包含的文档集的内容相似度进行分组,使得内容上相近或相似的普通节点连接同一个超级节点。其次,所有的超级节点组成结构化网络,用于维护“词→相关超级节点列表”的全局查询目录,并且每个超级节点独立维护“词→组内相关普通节点列表”的组内查询目录。本方法利用分层的网络模型和粗粒度的全局查询目录,使得这个P2P全文检索系统能够适应大量节点频繁加入或退出的情况,并且保证查询的性能和减少查询目录的维护代价。
搜索关键词: 一种 基于 p2p 网络 实现 全文 检索系统 方法
【主权项】:
1.一种基于P2P网络实现全文检索系统的方法,其特征在于,包括以下步骤:(1)基于内容分类:将普通节点看作一个“大文件”,这个“大文件”是由它所共享的文档集合并而成。利用文本分类技术将所有普通节点分成若干个组。每个组内所有普通结点连接同一个超级节点。普通节点按内容分组后,每个查询的结果集中在少数组中,这样可以减少查询消息的跳转次数。(2)构建组内查询目录:超级节点收集普通节点发送的资源描述信息,并构建组内查询目录,用于将选择某些最优的普通节点来转发查询。(3)构建全局查询目录:通过合并它的普通节点的资源描述,超级节点得到组内资源描述信息。超级节点将组内资源描述信息发布到由所有超级结点构成的DHT网络中。随着所有超级节点完成资源描述发布过程,全局查询目录也就构建完成。(4)两阶段检索过程:某个普通节点发起查询,并将查询请求转发至它所连接的超级结点。利用全局查询目录,超级节点获得与查询关键词相关超级节点列表;收到查询请求的各个超级节点根据组内查询目录,向与查询关键词相关的普通节点转发查询。(5)查询目录维护:在普通节点加入或退出时,相应的超级节点独立地在本地更新组内查询目录。对于全局查询目录,我们采用“生存时间”技术来保证全局查询目录的一致性和有效性,即对任意一个全局查询目录项,如果在TTL时间内没有被更新或确认,这个全局查询目录项将被删除。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810061395.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top