[发明专利]一种基于Elasticsearch的异构多数据源的高效搜索引擎方法在审
申请号: | 202110176379.1 | 申请日: | 2021-02-09 |
公开(公告)号: | CN112988863A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 刘小春;张亚军;姚亮;李坡 | 申请(专利权)人: | 苏州中科蓝迪软件技术有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/951;G06F16/9538 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 胡文强 |
地址: | 215000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 elasticsearch 多数 高效 搜索引擎 方法 | ||
本发明公开一种基于Elasticsearch的异构多数据源的高效搜索引擎方法。对时空对象数据库(关系型数据库和非关系型数据库)、分布式文件系统和信息资源管理系统中的信息实现异构、多数据源的高效全文搜索方法。该搜索引擎由索引数据库、索引文档结构、数据采集器和搜索接口四部分组成。包括如下步骤:首先,数据采集器采集系统中需要搜索的内容数据,并将内容数据组织构建为对应的索引文档;然后将构建的索引文档存储到索引数据库中;最后通过搜索接口进行搜索查询。本发明可将企业级不同类型的、多个数据源的数据汇聚到一个系统,为数据融合分析提供支撑。
技术领域
本发明涉及信息搜索技术领域,特别是涉及一种基于Elasticsearch的异构多数据源的高效搜索引擎方法。
背景技术
目前,商用搜索引擎如百度等根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户。由搜索器、索引器、检索器和用户接口四个部分组成。搜索器的功能是在互联网中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
对于企业级用户,自有的信息资源包括多种类型。例如某地理信息系统企业,管理多粒度时空对象库,管理的对象包含多粒度时空对象的时空参考、空间位置、空间形态、关联关系、组成结构、行为和认知能力、属性特征等多个方面,这些信息存放在PostgreSQL、MySQL、MongoDB等多种数据库,以及分布式文件系统HDFS中,还包括企业网站展示的信息资源等。显然,时空对象数据库不具备快速查询所有这些资源中所需信息的能力,这一问题亟需解决。
发明内容
为了能在时空对象数据库系统、分布式文件系统和信息资源管理系统的基础上实现多数据源的高效搜索,解决数据库不具备的搜索能力,本发明提供了一种基于Elasticsearch的异构多数据源的高效搜索引擎方法,具体技术方案如下:
一种基于Elasticsearch的异构多数据源的高效搜索引擎方法,包括索引数据库、索引文档、数据采集器和搜索接口四部分组成,数据采集器的采集系统中需要搜索的内容数据,并将内容数据组织构建为对应的索引文档,然后,将构建的索引文档存储到索引数据库中,最后,用户通过搜索接口进行搜索查询;
所述索引数据库Elasticsearch与关系型数据库或非关系型数据库配合使用,利用Elasticsearch的实时搜索和分析功能,使用Elasticsearch-Hadoop(ES-Hadoop)连接器,处理Hadoop数据库中的大量数据;
所述索引文档结构采用Elasticsearch支持的索引文档类型JSON,通过Elasticsearch可以将时空对象创建索引文档,JSON数据文档格式,搜索引擎支持索引的文档内容类型包括多粒度时空对象和集成开发框架资源服务中包含的资源,通过对这两种数据内容创建JSON对象,构建文档索引,每一个对象作为一个JSON文档,并建立索引;
所述数据采集器采集系统需要搜索的内容数据,并将内容数据组织构建为对应的索引文档,通过定时任务,主动定时抓取多粒度时空对象、集成开发框架资源服务中的数据进行文档存储。
所述搜索接口用于接收用户通过用户终端发起的搜索请求,并根据所述搜索请求从所述索引数据库获取相应的搜索结果以返回给所述用户终端,用户通过引擎接口,进行搜索、查询等操作,提供的引擎接口主要是根据关键字搜索,支持将搜索结果按照用户指定的次序排序显示,并提供搜索相关性反馈机制。
具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州中科蓝迪软件技术有限公司,未经苏州中科蓝迪软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110176379.1/2.html,转载请声明来源钻瓜专利网。