[发明专利]数据库优化器的统计信息处理和使用方法及存储设备有效
申请号: | 202010111247.6 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111274270B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 丁晓晖;谭忠涛;王兴家 | 申请(专利权)人: | 北京东方金信科技有限公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2458;G06F16/22 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 刘美丽 |
地址: | 100062 北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 优化 统计 信息处理 使用方法 存储 设备 | ||
本发明涉及一种数据库优化器的统计信息处理和使用方法及存储设备,该方法的具体过程为:S1、构造包括特定约束条件统计信息、热点统计信息和传统统计信息的多层统计信息;S2、使用分层查找的方式从多层统计信息中获得指定约束条件的选择度、热点区间直方图统计信息以及全区间直方图统计信息,进而得到指定约束条件的估计行数。本发明采用分精度的多层统计信息的存储结构设计,降低了系统的耦合性,基于业务查询特征动态构建的高精度的统计信息有针对性的用于特定查询和特定数据区间查询的优化。
技术领域
本发明是关于一种数据库优化器的统计信息处理和使用方法及存储设备,涉及数据库优化技术领域。
背景技术
基于代价的查询优化CBO(Cost Base Optimizer)也可以称为代价优化,物理优化,其主要流程是枚举各种待选的物理查询路径,并且根据上下文信息计算这些待选路径的代价,进而选择出代价最小的路径。
数据库的物理优化需要计算各种物理路径的代价,而代价的估算过程依赖数据库的统计信息。统计信息是否能够准确描述表中数据的分布情况是决定代价评估准确性的重要条件之一。常见的表级别的统计信息如表1所示,列级别统计信息如表2所示:
表1
tuple]]> 总行数 page]]> 总页面数
表2
在大数据量情况下,统计信息的生成并不是使用全部数据,而是随机采样一部分数据行进行生成。增加样本空间可提升统计的显著性,但是会降低统计信息计算的性能,在精度和性能之间需要进行平衡。通过统计信息,代价估算系统可估算出约束条件过滤出的数据占总数据量的比例,这一比例称为“选择度”。选择度是估算结果集行数的依据,其准确性直接影响优化器的路径选择。
常规的统计信息处理中,提高统计准确度的方法是增大样本容量,即提高采样率,其局限在于:1)过高的采样率会降低统计信息计算的性能,增加维护的代价。在典型的存在数据不断更新的业务场景下,统计信息也需要同步更新,从而严重影响数据库查询的性能;2)缺少对实际查询中发生的数据访问特征的统计和反馈机制。
发明内容
针对上述问题,本发明的目的是提供一种数据库优化器的统计信息处理和使用方法及存储设备,通过记录实际查询中的数据访问特征和使用多层统计信息的方式有效提高代价评估的准确性,提升数据库查询的性能。
为了实现上述目的,本发明采用的技术方案为:
第一方面,本发明提供一种数据库优化器的统计信息处理和使用方法,具体过程S1、构造包括特定约束条件统计信息、热点统计信息和传统统计信息的多层统计信息;
S2、使用分层查找的方式从多层统计信息中获得指定约束条件的选择度、热点区间直方图统计信息以及全区间直方图统计信息,进而得到指定约束条件的估计行数。
进一步地,上述步骤S1的具体过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京东方金信科技有限公司,未经北京东方金信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010111247.6/2.html,转载请声明来源钻瓜专利网。