[发明专利]一种基于P2P网络实现全文检索系统的方法无效
申请号: | 200810061395.0 | 申请日: | 2008-04-25 |
公开(公告)号: | CN101272399A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | 胡天磊;陈刚;陈珂;寿黎但;任祖杰 | 申请(专利权)人: | 浙江大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 周烽 |
地址: | 310027浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 p2p 网络 实现 全文 检索系统 方法 | ||
1.一种基于P2P网络实现全文检索系统的方法,其特征在于,包括以下步骤:
(1)基于内容分类:将普通节点看作一个“大文件”,这个“大文件”是由它所共享的文档集合并而成。利用文本分类技术将所有普通节点分成若干个组。每个组内所有普通结点连接同一个超级节点。普通节点按内容分组后,每个查询的结果集中在少数组中,这样可以减少查询消息的跳转次数。
(2)构建组内查询目录:超级节点收集普通节点发送的资源描述信息,并构建组内查询目录,用于将选择某些最优的普通节点来转发查询。
(3)构建全局查询目录:通过合并它的普通节点的资源描述,超级节点得到组内资源描述信息。超级节点将组内资源描述信息发布到由所有超级结点构成的DHT网络中。随着所有超级节点完成资源描述发布过程,全局查询目录也就构建完成。
(4)两阶段检索过程:某个普通节点发起查询,并将查询请求转发至它所连接的超级结点。利用全局查询目录,超级节点获得与查询关键词相关超级节点列表;收到查询请求的各个超级节点根据组内查询目录,向与查询关键词相关的普通节点转发查询。
(5)查询目录维护:在普通节点加入或退出时,相应的超级节点独立地在本地更新组内查询目录。对于全局查询目录,我们采用“生存时间”技术来保证全局查询目录的一致性和有效性,即对任意一个全局查询目录项,如果在TTL时间内没有被更新或确认,这个全局查询目录项将被删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810061395.0/1.html,转载请声明来源钻瓜专利网。