[发明专利]一种分布式全文检索系统有效
申请号: | 201210362934.0 | 申请日: | 2012-09-25 |
公开(公告)号: | CN102831253A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 何蕾;李勇;曹宇;喻宏元;苏迤;庞传军;聂春元;杨笑宇;徐家慧;武毅;林海峰;方伟 | 申请(专利权)人: | 北京科东电力控制系统有限责任公司;华中电网有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 皋吉甫 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 全文 检索系统 | ||
1.一种分布式全文检索系统,所述系统由设置在各网络节点上的全文检索服务器组成,包括分布式节点服务器及系统中心服务器;其特征在于:
所述分布式节点服务器包括文件信息检索模块及服务器间通讯模块;
所述文件信息检索模块对本节点服务器上文件定时进行全文信息的检索,按照定义好的词库进行切词,提取关键词信息并建立索引文件;
所述服务器间通讯模块实现分布式节点服务器与系统中心服务器与之间的信息交换,将本节点的索引文件发送到系统中心服务器;
所述系统中心服务器对各节点服务器传送的索引文件进行合并,生成新的索引文件并更新已有索引信息,增加新的文件信息;向用户提供查询接口,响应用户查询文件的请求、分析用户请求,将查询关键词在新的索引文件中进行检索比对,将符合的文件作为查询结果展示给用户。
2.根据权利要求1所述的一种分布式全文检索系统,其特征在于:所述分布式节点服务器上生成的索引文件包括文件名称、关键词条、文件分类、所在服务器的IP地址、服务器信息、文件大小、文件作者等相关信息。
3.根据权利要求1所述的一种分布式全文检索系统,其特征在于,所述系统中心服务器进一步包括:
各个分布式节点服务器状态查询模块及系统重启服务模块;并具有文件在线浏览与下载模块,即系统中心服务器接收下载文件请求,并根据该文件在索引文件中的描述,将请求转发给相应的节点服务器,将读取文件的字节流返给用户实现下载。
4.根据权利要求1所述的一种分布式全文检索系统,其特征在于:所述分布式节点服务器还包括:词库管理模块,所述词库管理模块在遍历文件全文内容时根据已有词库进行切词划分,将文件内容切成不同的关键词,然后统计关键词出现的频度和关键词的分类,一同写入到索引文件中。
5.根据权利要求4所述的一种分布式全文检索系统,其特征在于:所述词库管理模块按照电网相关技术知识进行统计划分,包括电网文件类、技术论文类、电网设备类、新闻类等;对普通的助词、语气词或普通描述性的词进行过滤。
6.根据权利要求5所述的一种分布式全文检索系统,其特征在于:所述分布式节点服务器上安装词库管理客户端,所述客户端对在文件中出现频度较高的词,通过用户手动维护的关键词等添加到索引文件中更新词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科东电力控制系统有限责任公司;华中电网有限公司,未经北京科东电力控制系统有限责任公司;华中电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210362934.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种行车磨电道缺相及断电快速判断的装置
- 下一篇:汽车车门自动报警器