[发明专利]一种基于数据源的大数据量聚合查询的优化方法及装置在审

专利信息
申请号: 202211421793.5 申请日: 2022-11-07
公开(公告)号: CN115687407A 公开(公告)日: 2023-02-03
发明(设计)人: 周朝卫;刘钧;张梅;周世军;覃华云 申请(专利权)人: 中盈优创资讯科技有限公司
主分类号: G06F16/2453 分类号: G06F16/2453;G06F16/242;G06F16/215
代理公司: 上海嘉蓝专利代理事务所(普通合伙) 31407 代理人: 金波
地址: 200000 上海市嘉*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据源 数据量 聚合 查询 优化 方法 装置
【权利要求书】:

1.一种基于数据源的大数据量聚合查询的优化方法,其特征在于,该方法包括:

Spark在数据写入时,根据定义的预聚合表达式,对数据进行预聚合,生成的预聚合数据和明细数据在同一个事务中,并同时写入存储介质;

通过手工执行自定义的预聚合触发命令,根据通过专用命令定义的预聚合表达式,对存量的明细数据进行预聚合,生成预聚合数据;

数据查询时,解析查询语句,从定义的预聚合表达式中,匹配到最优的预聚合表达式进行数据查询。

2.根据权利要求1所述的基于数据源的大数据量聚合查询的优化方法,其特征在于,数据查询时,解析查询语句,从定义的预聚合表达式中,匹配到最优的预聚合表达式进行数据查询,包括:

数据查询时,读取明细数据目录下的预聚合表达式文件;

解析查询语句,从预聚合表达式文件中匹配预聚合表达式;

若匹配到一个预聚合表达式,则查询语句从该预聚合表达式对应的预聚合数据子目录中查询数据;

若匹配到多个预聚合表达式,则查询语句从多个预聚合表达式中选择指定的预聚合的列数量最小的预聚合表达式,再从该预聚合表达式对应的预聚合数据子目录中查询数据;

若未匹配到预聚合表达式,则从明细数据子目录中查询数据。

3.根据权利要求1所述的基于数据源的大数据量聚合查询的优化方法,其特征在于,Spark在数据写入时,在明细数据存放的目录下,生成一个专用的子目录,在该子目录下新建一个预聚合表达式文件,存储在数据源建表时指定的至少一个预聚合表达式。

4.根据权利要求3所述的基于数据源的大数据量聚合查询的优化方法,其特征在于,Spark在数据写入时,读取明细数据目录下的预聚合表达式文件,确定预聚合表达式,根据该预聚合表达式对当前的明细数据进行预聚合,生成预聚合数据;每次数据写入时,在明细数据目录下生成一个新的子目录,存储当前明细数据,同时在新的子目录下再生成一个以预聚合名称命名的子目录,存储预聚合数据。

5.根据权利要求4所述的基于数据源的大数据量聚合查询的优化方法,其特征在于,Spark在数据写入时,定期对同一个分区的多个明细数据子目录执行合并,合并后,原有的分区的明细数据子目录的最后状态字段标记为0,新生成的分区的明细数据子目录的最后状态字段标记为1。

6.一种基于数据源的大数据量聚合查询的优化装置,其特征在于,该装置包括:

写入数据预聚合模块,用于Spark在数据写入时,根据定义的预聚合表达式,对数据进行预聚合,生成的预聚合数据和明细数据在同一个事务中,并同时写入存储介质;

存量明细数据预聚合模块,用于通过手工执行自定义的预聚合触发命令,根据通过专用命令定义的预聚合表达式,对存量的明细数据进行预聚合,生成预聚合数据;

数据优化查询模块,用于数据查询时,解析查询语句,从定义的预聚合表达式中,匹配到最优的预聚合表达式进行数据查询。

7.根据权利要求6所述的基于数据源的大数据量聚合查询的优化装置,其特征在于,所述数据优化查询模块,具体用于:

数据查询时,读取明细数据目录下的预聚合表达式文件;

解析查询语句,从预聚合表达式文件中匹配预聚合表达式;

若匹配到一个预聚合表达式,则查询语句从该预聚合表达式对应的预聚合数据子目录中查询数据;

若匹配到多个预聚合表达式,则查询语句从多个预聚合表达式中选择指定的预聚合的列数量最小的预聚合表达式,再从该预聚合表达式对应的预聚合数据子目录中查询数据;

若未匹配到预聚合表达式,则从明细数据子目录中查询数据。

8.根据权利要求6所述的基于数据源的大数据量聚合查询的优化装置,其特征在于,Spark在数据写入时,在明细数据存放的目录下,生成一个专用的子目录,在该子目录下新建一个预聚合表达式文件,存储在数据源建表时指定的至少一个预聚合表达式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中盈优创资讯科技有限公司,未经中盈优创资讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211421793.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top