[发明专利]一种hbase数据索引到查询引擎的方法和相关装置在审
申请号: | 202011554773.6 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112612805A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 申胜利 | 申请(专利权)人: | 北京浪潮数据技术有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/22;G06F16/25 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hbase 数据 索引 查询 引擎 方法 相关 装置 | ||
本申请提供了一种hbase数据索引到查询引擎的方法、装置、系统、索引器和介质,该方法包括:接收hbase源端发送的wal批量导入指令信息;根据所述wal批量导入指令信息读取zookeeper中的hfile文件位置信息;根据所述hfile文件位置信息读取hfile文件,并将所述hfile文件转换成索引数据;将索引数据批次地写入对应的查询引擎中。本申请实现了批量数据的导入,降低了成本,也拓宽了索引器的使用场景,不再限制hbase源端的数据导入方式,改善用户体验。
技术领域
本申请涉索引技术领域,特别涉及一种hbase数据索引到查询引擎的方法、装置、系统、索引器和介质。
背景技术
hbase数据没有全文检索功能,只能在直接查询行键的场景下保持高效,不能兼容全文检索的功能,所以某些场景需要将数据索引到其它查询引擎。hbase-indexer就是为了这种情况诞生的,能将数据索引到solr企业级搜索应用服务器中,还有一些索引到ES(elasticsearch)搜索服务器的方案,但是这些方案中准实时场景很多是类似hbase的replication的,基于hbase的wal机制,而全量或者增量索引到其它引擎的场景就靠扫描hbase全表,筛选范围的方式。相比准实时和全量索引数据的场景,批量的方案从性能低和使用成本高。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本申请的目的是提供一种hbase数据索引到查询引擎的方法、装置、系统、索引器和介质,能够实现批量数据的导入,降低了成本,也拓宽了索引器的使用场景。其具体方案如下:
本申请提供了一种hbase数据索引到查询引擎的方法,包括:
接收hbase源端发送的wal批量导入指令信息;
根据所述wal批量导入指令信息读取zookeeper中的hfile文件位置信息;
根据所述hfile文件位置信息读取hfile文件,并将所述hfile文件转换成索引数据;
将所述索引数据批次地写入对应的查询引擎中。
优选地,所述将所述hfile文件转换成索引数据,包括:
解析所述hfile文件,得到行数据集合;
依次的根据索引规则将所述行数据集合中的每行数据进行转换,得到所述索引数据。
优选地,所述将所述索引数据批次地写入对应的查询引擎中之后,还包括:
当所述索引数据成功写入所述查询引擎中后,发送写入成功信息至所述hbase源端,以便所述hbase源端清除所述zookeeper中的所述hfile文件位置信息,并删除所述hfile文件。
优选地,所述接收hbase源端发送的wal批量导入指令信息之前,还包括:
配置所述hbase源端的批量加载的数据复制功能,以使所述hbase源端根据所述数据复制功能在执行批量加载时,发送所述wal批量导入指令信息至索引器,并将对应的批量加载的所述hfile文件位置信息存储至所述zookeeper中,且,当所述hfile文件合并或者region合并或分裂时,在完成所述索引数据写入所述查询引擎前,不删除所述hfile文件和所述zookeeper中的信息。
本申请提供了一种hbase数据索引到查询引擎的装置,包括:
Wal信息接收模块,用于接收hbase源端发送的wal批量导入指令信息;
位置信息读取模块,用于根据所述wal批量导入指令信息读取zookeeper中的hfile文件位置信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京浪潮数据技术有限公司,未经北京浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011554773.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种市政环卫车清洁系统
- 下一篇:一种硫属元素弱相互作用催化合成吡咯烷的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置