[发明专利]数据库表的处理方法和系统在审
申请号: | 202210314941.7 | 申请日: | 2022-03-28 |
公开(公告)号: | CN114661721A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 余从佳;王腾 | 申请(专利权)人: | 阿里云计算有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/242;G06F16/2455;G06F16/27;G06F16/28 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 吴梅锡;许怀远 |
地址: | 310024 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 处理 方法 系统 | ||
1.一种数据库表的处理方法,其特征在于,包括:
采集单机数据库的数据库审计日志和统计信息;
接收存储节点的个数,所述存储节点为:分布式数据库中用于存储所述单机数据库中表的存储节点;
根据所述数据库审计日志,得到所述表的语句执行信息;
根据所述语句执行信息、所述统计信息,以及所述存储节点的个数,获取所述表的拆分信息;
根据所述表的拆分信息,输出所述表的拆分建议。
2.根据权利要求1所述的方法,其特征在于,所述语句执行信息包括:每个候选列关联的语句的执行次数比例,候选列为:所述表关联的语句涉及到的列;
所述根据所述数据库审计日志,得到所述表的语句执行信息,包括:
将所述数据库审计日志进行脱敏处理,得到所述表关联的语句的第一执行次数,以及所述表关联的每个语句涉及到的列,以得到所述候选列;
根据所述每个候选列关联的语句的第二执行次数,以及所述第一执行次数,获取所述每个候选列关联的语句的执行次数比例。
3.根据权利要求2所述的方法,其特征在于,所述拆分信息包括:拆分键,所述拆分键用于对所述表进行拆分,所述统计信息包括:所述表中每个列的区分度;
所述根据所述语句执行信息、所述统计信息,以及所述存储节点的个数,获取所述表的拆分信息,包括:
A,在第i次循环中,根据第i-1次拆分后的表的行信息和/或所述第i-1次拆分后的表的数据量,检测是否对所述第i-1次拆分后的表进行第i次拆分,若是,执行步骤B、步骤C,所述i为大于或等于1的整数,当所述i为1时,所述第i-1次拆分后的表为:未经拆分的表;
B,根据多个候选列中的部分候选列的执行次数比例,以及所述部分候选列的区分度,确定第i次拆分的拆分键;
C,根据第i-1次拆分后的表的行信息和/或所述第i-1次拆分后的表的数据量,以及所述存储节点的个数,确定每个所述i-1次拆分后的表经第i次拆分后的数量。
4.根据权利要求3所述的方法,其特征在于,当所述i为1时,所述部分候选列为所述多个候选列中的至少一个第一候选列,每个第一候选列中包括表中的一列;
所述根据多个候选列中的部分候选列的执行次数比例,以及所述部分候选列的区分度,确定第i次拆分的拆分键,包括:
根据所述每个第一候选列关联的语句的执行次数比例,以及所述每个第一候选列的区分度,在所述至少一个第一候选列中确定第一目标列;
将所述第一目标列的类型作为第一拆分键。
5.根据权利要求4所述的方法,其特征在于,所述在所述至少一个第一候选列中确定第一目标列,包括:
将区分度大于预设区分度,且大于预设比例中最大执行次数比例的第一候选列作为所述第一目标列。
6.根据权利要求5所述的方法,其特征在于,当所述i为2时,所述部分候选列为所述多个候选列中的至少一个第二候选列,每个第二候选列中包括表中的至少一列,且所述至少一列中包括所述第一目标列;
所述根据多个候选列中的部分候选列的执行次数比例,以及所述部分候选列的区分度,确定第i次拆分的拆分键,包括:
根据所述每个第二候选例关联的语句的执行次数比例,以及所述每个第二候选例的区分度,在所述至少一个第二候选列中确定第二目标列;
在所述第二目标列的类型中,将除了所述第一拆分键的剩余类型作为第二拆分键。
7.根据权利要求4或5所述的方法,其特征在于,所述根据所述数据库审计日志,得到所述表的语句执行信息之前,还包括:
采集表结构,所述表结构中包括字段类型;
所述将所述第一目标列的类型作为第一拆分键之后,包括;
根据所述字段类型,检测所述第一拆分键是否可用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210314941.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:数据处理方法、装置、备用数据库及业务系统