[发明专利]一种实时大数据搜索引擎系统在审
申请号: | 201711362882.6 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108228743A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 张云翔;饶竹一 | 申请(专利权)人: | 深圳供电局有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 熊贤卿;潘中毅 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种实时大数据搜索引擎系统,基于HTTP协议,运用Apache Lucene构建而成,其架构至少包括:采集各种格式的文档和数据的采集器;根据文档的分析处理结果创建对应索引的索引器;储存索引的索引库;集合带有索引的各文档的信息资源库;接收外界用户端输入的查询信息和返回查询结果的搜索器;进行检索工作的大数据内核。本发明实施例可实现实时流数据的全文搜索。 | ||
搜索关键词: | 大数据 文档 索引 搜索引擎系统 分析处理结果 信息资源库 查询结果 查询信息 全文搜索 外界用户 采集器 实时流 搜索器 索引库 索引器 构建 内核 检索 集合 架构 采集 储存 返回 创建 | ||
【主权项】:
1.一种实时大数据搜索引擎系统,其特征在于,包括:采集器,采集来自于所述实时大数据搜索引擎系统外部的各种格式的文档和数据;索引器,对所述采集器所采集到的各种格式的文档以及数据库数据进行信息抽取,并根据文档类型选择相对应的文本分析器进行文本分析,创建各文档对应的索引;索引库,收集并储存所述索引器产生的索引;信息资源库,集合带有索引的各文档,并与所述索引库中的对应索引建立关联;搜索器,接收外界用户端输入的查询信息,并生成并传递搜索请求同时将搜索结果进行排序后反馈给所述外界用户端;大数据内核,接收所述搜索器传递的所述搜索请求,在所述索引库内进行对应的索引检索并在所述信息资源库内提取对应的文件,同时反馈检索的结果和检索到的文件给到所述搜索器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711362882.6/,转载请声明来源钻瓜专利网。