[发明专利]一种数据存储规则自动推荐方法、装置、设备及可读存储介质有效
申请号: | 201910696205.0 | 申请日: | 2019-07-30 |
公开(公告)号: | CN110532262B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 安云杰;魏建钟;刘强 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/21 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 存储 规则 自动 推荐 方法 装置 设备 可读 介质 | ||
1.一种数据存储规则自动推荐方法,其特征在于,包括:
响应于数据优化存储请求,提取数据仓库中多个数据表;
获取用户针对各所述数据表配置的存储规则;
根据所述存储规则重新存储所述多个数据表为待优化数据表;
获取所述待优化数据表的属性;
根据所述待优化数据表的属性,确定所述待优化数据表的多个可优化存储方案;
计算各所述可优化存储方案的存储效益,其中,根据可优化分区归档方案,或可优化压缩存储方案、或可优化模型优化方案中的多种,计算各所述可优化存储方案的存储效益;
将所述存储效益最高的所述可优化存储方案作为最优存储方案,推荐给所述用户;
所述计算各所述可优化存储方案的存储效益,包括:
提取采用所述可优化分区归档方案时,所述待优化数据表的分区查询热度小于预设阈值的连续分区;
计算所述连续分区的存储收益,确定为所述待优化数据表的存储收益;
或,
提取采用所述可优化压缩存储方案时,所述待优化数据表中的重复字段以及对应的重复率;
根据所述重复率计算所述重复字段的存储收益,确定为所述待优化数据表的存储收益;
或,
提取采用所述可优化模型优化方案时,所述待优化数据表中的相同粒度表;
提取所述相同粒度表中的冗余字段;
计算所述冗余字段的存储收益,确定为所述待优化数据表的存储收益。
2.根据权利要求1所述的方法,其特征在于,所述根据所述存储规则重新存储所述多个数据表为待优化数据表,包括:
根据所述存储规则提取各所述数据表中对应的元数据;
将所述元数据重新存储为待优化数据表。
3.根据权利要求2所述的方法,其特征在于,所述将所述元数据重新存储为待优化数据表,包括:
提取所述元数据的元数据指标;所述元数据指标包括分区热度存储、字段重复记录存储、表间字段冗余存储、文件大小存储中的一种或多种;
将所述元数据按照所述分区热度存储,和/或所述字段重复记录存储,和/或所述表间字段冗余存储,和/或所述文件大小存储为待优化快照表,或待优化全量表,或待优化增量表。
4.根据权利要求3所述的方法,其特征在于,所述获取所述待优化数据表的属性,包括:
根据所述元数据指标,确定所述待优化数据表的表属性;所述表属性包括快照表,或全量表,或增量表。
5.根据权利要求4所述的方法,其特征在于,所述根据所述待优化数据表的属性,确定所述待优化数据表的多个可优化存储方案,包括:
在预设指标方案对应关系列表中为所述待优化快照表,或所述待优化全量表,或所述待优化增量表选择可优化分区归档方案,或可优化压缩存储方案、或可优化模型优化方案中的多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910696205.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置