[发明专利]一种分布式医疗搜索引擎系统的构建方法在审
申请号: | 201610886529.7 | 申请日: | 2016-10-11 |
公开(公告)号: | CN107918625A | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 李淑范 | 申请(专利权)人: | 哈尔滨光凯科技开发有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150070 黑龙江省哈尔滨市*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分布式医疗搜索引擎系统的构建方法,所述方法包括以下步骤第一步,分析分布式搜索研究的现状,指出分布式搜索引擎技术在医疗搜索领域应用的必要性;第二步,分析基于Lucene搜索引擎工具包开发搜索引擎的相关技术与原理;第三步,分析Hadoop分布式文件系统和MapReduce计算模型的技术;第四步,结合heartbeat和drbd技术设计出具有高容错性的分布式集群环境。本发明的分布式医疗搜索引擎系统的构建方法,基于Lucene搜索引擎工具包,将搜索引擎技术与hadoop开源分布式集群框架相结合,设计一基于Lucene与Hadoop的分布式医疗搜索引擎系统。 | ||
搜索关键词: | 一种 分布式 医疗 搜索引擎 系统 构建 方法 | ||
【主权项】:
一种分布式医疗搜索引擎系统的构建方法,其特征在于,所述方法包括以下步骤:第一步,介绍当今搜索引擎技术的发展概况,分析分布式搜索研究的现状,指出分布式搜索引擎技术在医疗搜索领域应用的必要性;第二步,分析基于Lucene搜索引擎工具包开发搜索引擎的相关技术与原理;结合PageRank排序算法与基于相关性排序算法设计出适用于专业搜索的新排序算法;第三步,分析Hadoop分布式文件系统和MapReduce计算模型的技术;在HDFS和MapReduce相结合的基础上,设计出分布式爬虫程序,进行分布式信息抓取与索引;第四步,结合heartbeat和drbd技术设计出具有高容错性的分布式集群环境,为系统提供了容错性更高的环境基础;相关技术运用到实际工程中,设计出一款适用于医疗搜索的分布式搜索引擎,并通过性能对比和结果分析,从系统运行效率和查准率两个方面来体现分布式医疗搜索引擎的优势与不足。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨光凯科技开发有限公司,未经哈尔滨光凯科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610886529.7/,转载请声明来源钻瓜专利网。