[发明专利]通过列式存储格式的全面位图索引进行高效扫描在审
申请号: | 202080101368.0 | 申请日: | 2020-07-24 |
公开(公告)号: | CN115698978A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 马继红;徐帅;蒋晓伟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 存储 格式 全面 位图 索引 进行 高效 扫描 | ||
1.一种在数据分析存储引擎中执行查询的方法,所述方法包括:
接收查询以在所述数据分析存储引擎中定位目标数据,所述数据分析存储引擎包括:
被划分为数据的一个或更多个分割的数据行,所述一个或更多个分割具有对应于所述数据行的数据列,以及
嵌入在所述一个或更多个分割中的位图数据,其中所述位图数据与所述数据列相关联;以及
使用所述一个或更多个分割中的所述位图数据定位所述目标数据。
2.根据权利要求1所述的方法,其中使用所述一个或更多个分割中的所述位图数据定位所述目标数据还包括:
对存储在所述位图数据中的一个或更多个值执行按位运算以定位所述目标数据。
3.根据权利要求2所述的方法,其中:
所述数据分析存储引擎还包括嵌入在所述一个或更多个分割中的位图索引数据,其中所述位图索引数据与嵌入在所述一个或更多个分割中的所述位图数据相关联;并且
使用所述一个或更多个分割中的所述位图数据定位所述目标数据还包括:
使用所述位图索引数据定位存储在所述位图数据中的所述一个或更多个值。
4.根据权利要求1所述的方法,其中:
所述一个或更多个分割中的所述数据列被划分为数据块;并且
使用所述一个或更多个分割中的所述位图数据定位所述目标数据还包括:
使用所述位图数据定位包括所述目标数据的数据块;以及
访问所述数据块。
5.根据权利要求2所述的方法,其中:
所述数据分析存储引擎还包括嵌入在所述一个或更多个分割中的字典数据,其中所述字典数据与所述数据列相关联;并且
使用所述一个或更多个分割中的所述位图数据定位所述目标数据还包括:
使用字典数据定位存储在所述位图数据中的所述一个或更多个值。
6.根据权利要求5所述的方法,其中:
所述字典数据包括所述查询中的谓词值和所述一个或更多个值的映射信息;并且
使用字典数据定位存储在所述位图数据中的所述一个或更多个值还包括:
根据所述映射信息定位存储在所述位图数据中的所述一个或更多个值。
7.根据权利要求1所述的方法,其中:
所述位图数据是咆哮位图。
8.一种数据分析存储引擎系统,包括:
被划分为数据的一个或更多个分割的数据行,所述一个或更多个分割具有对应于所述数据行的数据列,以及
嵌入在所述一个或更多个分割中的位图数据,其中所述位图数据与所述数据列相关联,并且所述位图数据被配置为在所述一个或更多个分割中定位查询中的目标数据。
9.根据权利要求8所述的数据分析存储引擎系统,其中位图数据还被配置为:
进行对存储在所述位图数据中的一个或更多个值执行以定位所述目标数据的按位运算。
10.根据权利要求9所述的数据分析存储引擎系统,其中:
所述数据分析存储引擎系统还包括嵌入在所述一个或更多个分割中的位图索引数据,其中所述位图索引数据与嵌入在所述一个或更多个分割中的所述位图数据相关联;并且
所述位图索引数据被配置为:
定位存储在所述位图数据中的所述一个或更多个值。
11.根据权利要求10所述的数据分析存储引擎系统,其中:
所述一个或更多个分割中的所述数据列被划分为数据块;并且
所述位图数据还被配置为:
定位包括所述目标数据的数据块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080101368.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:资源确定方法、终端设备和网络设备
- 下一篇:制冷剂分配器、热交换器和空调装置