[发明专利]一种检索数据的方法、建立索引库的方法及装置在审
申请号: | 201810797321.7 | 申请日: | 2018-07-19 |
公开(公告)号: | CN110737692A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 雷超 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22 |
代理公司: | 11138 北京三高永信知识产权代理有限责任公司 | 代理人: | 刘映东 |
地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引集合 记录标识 目标索引 数据记录 检索条件 目标记录 索引库 检索 数据存储领域 检索数据 建立索引 数据对应 索引 申请 | ||
本申请是关于一种检索数据的方法、建立索引库的方法及装置,属于数据存储领域。所述方法包括:根据待检索的检索条件,生成所述检索条件对应的目标索引;根据所述目标索引,从索引库中获取所述目标索引对应的目标记录标识,所述索引库包括至少一个索引集合和每个索引集合对应的记录标识,所述索引集合包括Hbase中的一条数据记录中的每个数据对应索引,所述索引集合对应的记录标识为所述一条数据记录对应的记录标识;根据所述目标记录标识,从所述Hbase中获取对应的数据记录。本申请能够提高检索速度。
技术领域
本申请涉及数据存储领域,特别涉及一种检索数据的方法、建立索引库的方法及装置。
背景技术
Hbase是一种分布式存储系统,常常用于对海量数据进行分布式存储。在Hbase中存储的每个数据记录对应一个rowkey(唯一键),数据记录对应的rowkey是用于标识该数据记录的唯一标识。这样当需要从Hbase中检索某个数据记录时,可以根据该数据记录的rowkey从Hbase表中检索该数据记录。
使用数据记录的rowkey可以从Hbase表中快速检索出该数据记录,所需要的检索时间可能是毫秒级别。但使用除该rowkey以外的检索条件在从Hbase表中检索数据记录,检索的速度很慢。
发明内容
为了提高检索速度,本申请实施例提供了一种检索数据的方法、建立索引库的方法及装置。所述技术方案如下:
根据本申请实施例的第一方面,提供一种检索数据的方法,所述方法包括:
根据待检索的检索条件,生成所述检索条件对应的目标索引;
根据所述目标索引,从索引库中获取所述目标索引对应的目标记录标识,所述索引库包括至少一个索引集合和每个索引集合对应的记录标识,所述索引集合包括Hbase中的一条数据记录中的每个数据对应索引,所述索引集合对应的记录标识为所述一条数据记录对应的记录标识;
根据所述目标记录标识,从所述Hbase中获取对应的数据记录。
可选的,所述根据所述目标索引,从索引库中获取所述目标索引对应的目标记录标识,包括:
在所述索引库中获取包括所述目标索引的目标索引集合;
在所述索引库中获取与所述目标索引集合相对应的目标记录标识。
可选的,所述根据所述目标索引,从索引库中获取获取所述目标索引对应的目标记录标识之前,还包括:
生成所述Hbase中的数据记录对应的索引集合,将所述索引集合和所述数据记录对应的记录标识的对应关系保存在所述索引库中。
可选的,所述生成所述Hbase中的数据记录对应的索引集合,将所述索引集合和所述数据记录对应的记录标识的对应关系保存在所述索引库中,包括:
从所述Hbase中获取一条数据记录和所述数据记录对应的记录标识;
通过ES检索引擎,生成所述数据记录中的每个数据对应的索引,并组成所述数据记录对应的索引集合;
将所述索引集合和所述数据记录对应的记录标识的对应关系保存在所述索引库中。
根据本申请实施例的第二方面,提供一种建立索引库的方法,所述方法包括:
获取Hbase中的数据记录对应的索引集合和所述数据记录在所述Hbase中对应的记录标识,所述索引集合包括所述数据记录中的每个数据的索引;
将包括所述索引集合和所述数据记录对应的记录标识的对应关系保存在索引库中。
可选的,所述获取Hbase中的数据记录对应的索引集合和所述数据记录在所述Hbase中对应的记录标识,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810797321.7/2.html,转载请声明来源钻瓜专利网。