[发明专利]一种搜索引擎系统在审
申请号: | 201710099841.6 | 申请日: | 2017-02-23 |
公开(公告)号: | CN107092639A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 简小奇;何斌 | 申请(专利权)人: | 武汉智寻天下科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司11228 | 代理人: | 董佳佳,张瑾 |
地址: | 430070 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索引擎 系统 | ||
技术领域
本发明涉及互联网技术领域,特别涉及一种搜索引擎系统。
背景技术
目前常见的搜索引擎大都使用爬虫抓取互联网上各个站点的数据,使用PageRank算法对网页的检索结果进行排序,最终呈献给使用者的与其搜索相关的站点页面的链接。这种搜索引擎最大的局限在于只能检索到与需要检索的信息有关站点,且搜索引擎的海量信息无序化、信息量大、查询不准确、深度不够,并不能根据需要检索的信息直接定位到用户。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种搜索引擎系统。
第一方面,本发明实施例提供一种搜索引擎系统,包括:索引装置,用于从互联网索引与预设对象相关的数据;所述相关的数据包括以下一种或多种:名称、第三方网站中注册的用户名、地址、教育背景、技能、工作、联系方式;
数据处理装置,用于提取、格式化、聚合所述与预设对象相关的数据;
搜索装置,用于将处理好的所述与预设对象相关的数据,加载到基于Lucene的搜索服务器中,对聚合好的数据进行分词,以便能检索到所需要的数据信息,并提供接口;
交互装置,用于接收用户输入的查询指令,将所述查询指令转化为调用信息,根据所述调用信息,通过调用所述接口获取数据呈现给用户。
在一个实施例中,所述数据处理装置使用分布式计算框架Hadoop和/或Spark对所述相关的数据进行提取、格式化、聚合。
在一个实施例中,所述对所述相关的数据进行提取、格式化、聚合后存储在分布式文件系统HDFS构建的数据库中。
在一个实施例中,所述数据处理装置使用Spark加载到所述基于Lucene的搜索服务器中。
在一个实施例中,所述数据处理装置采用图数据库,图节点中存储所述与预设对象相关的数据,以边的方式来建立预设对象相关的数据彼此之间的关系,节点通过边构造出图模型,聚合成一个信息集合。
在一个实施例中,所述搜索装置使用分词器和词典对聚合好的数据进行分词;
所述词典基于计算机、IT、互联网领域文本构建。
在一个实施例中,所述交互装置使用语义分析对所述查询指令过滤。
在一个实施例中,所述交互装置还用于将过滤后的所述查询指令按照预设的规则转化为调用信息。
在一个实施例中,所述交互装置为基于React和Redux实现的前端交互系统。
在一个实施例中,所述数据处理装置根据所述与预设对象相关的数据,按照预设的算法,生成综合评分、网络活跃度。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的一种搜索引擎系统,包括索引装置,用于从互联网索引与预设对象相关的数据;所述相关的数据包括以下一种或多种:名称、第三方网站中注册的用户名、地址、教育背景、技能、工作、标签;数据处理装置,用于提取、格式化、聚合所述与预设对象相关的数据;搜索装置,用于将处理好的所述与预设对象相关的数据,加载到基于Lucene的搜索服务器中,对聚合好的数据进行分词,以便能检索到所需要的数据信息,并提供接口;交互装置,用于接收用户输入的查询指令,将所述查询指令转化为调用信息,根据所述调用信息,通过调用所述接口获取数据呈现给用户。本技术方案可以是针对互联网领域预设对象的垂直搜索,通过采集预设对象的相关信息,解析处理后,通过接收查询指令,为用户提供有一定价值的信息和相关服务,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎结果查询更准确、可以直接定位到预设的对象比如程序员。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的搜索引擎系统结构示意图;
图2为本发明实施例提供的相关的数据之间聚合示意图;
图3为本发明实施例提供的搜索引擎系统结构整体框架示意图;
图4为本发明实施例提供的用户使用该搜索引擎系统的流程图;
图5A为本发明实施例提供的使用本系统检索前端返回的页面示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉智寻天下科技有限公司,未经武汉智寻天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710099841.6/2.html,转载请声明来源钻瓜专利网。