[发明专利]基于LSM-tree的分级存储方法、装置、OLAP数据库系统及介质在审
申请号: | 201711437794.8 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108021702A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | 李超勇;牟宇航;马如悦 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lsm tree 分级 存储 方法 装置 olap 数据库 系统 介质 | ||
1.一种基于LSM-tree的分级存储方法,其特征在于,采用基于LSM-tree的树形结构组织数据库的文件存储,将导入数据库的文件进行合并操作;
所述合并操作包括累积合并操作和基本合并操作;
所述累积合并操作包括:将第一类型文件进行合并操作,所述第一类型文件包括已导入数据库、未进行合并操作,且满足累积合并条件的文件;
所述基本合并操作包括:将第二类型文件和所述累积合并操作生成的文件进行合并操作,所述第二类型文件包括已导入数据库、未进行合并操作,且不满足累积合并条件的文件。
2.根据权利要求1所述的方法,其特征在于,所述累积合并条件包括文件的大小小于等于预设的文件大小阈值。
3.根据权利要求1所述的方法,其特征在于,还包括:
在已导入数据库、未进行合并操作的文件数大于等于预设的第一文件数阈值的情况下,进行所述累积合并操作;或者,
在所述第一类型文件的文件数大于等于预设的第一文件数阈值的情况下,进行所述累积合并操作。
4.根据权利要求1所述的方法,其特征在于,还包括:在所述累积合并操作生成的文件数大于等于预设的第二文件数阈值的情况下,进行所述基本合并操作。
5.根据权利要求1所述的方法,其特征在于,还包括:在累积版本文件的总的字节数与基本版文件的总的字节数之比大于等于预设的比例阈值的情况下,进行所述基本合并操作;所述累积版本文件包括现有数据库中所有的所述累积合并操作生成的文件,所述基本版本文件包括现有数据库中所有的所述基本合并操作生成的文件。
6.根据权利要求1所述的方法,其特征在于,还包括:每隔预设的时间阈值时间,进行一次所述基本合并操作。
7.根据权利要求1所述的方法,其特征在于,还包括:在预设的时间点定时触发所述基本合并操作。
8.根据权利要求1-7中任一项所述的方法,其特征在于,还包括:
所述文件大小阈值的取值范围为3-5G;和/或,
所述第一文件数阈值的取值范围为5-8;和/或,
所述第二文件数阈值的取值范围为5-8;和/或,
所述比例阈值的取值范围为30%-50%;和/或,
所述时间阈值的取值范围为7天-10天。
9.一种基于LSM-tree的分级存储装置,其特征在于,
所述装置用于:采用基于LSM-tree的树形结构组织数据库的文件存储,将导入数据库的文件进行合并操作;所述合并操作包括累积合并操作和基本合并操作;所述装置包括累积合并单元和基本合并单元;
所述累积合并单元用于:将第一类型文件进行合并操作,所述第一类型文件包括已导入数据库、未进行合并操作,且满足累积合并条件的文件;
所述基本合并单元用于:将第二类型文件和所述累积合并操作生成的文件进行合并操作,所述第二类型文件包括已导入数据库、未进行合并操作,且不满足累积合并条件的文件。
10.根据权利要求9所述的装置,其特征在于,所述累积合并条件包括文件的大小小于等于预设的文件大小阈值。
11.根据权利要求9所述的装置,其特征在于,所述累积合并单元还用于:
在已导入数据库、未进行合并操作的文件数大于等于预设的第一文件数阈值的情况下,进行所述累积合并操作;或者,
在所述第一类型文件的文件数大于等于预设的第一文件数阈值的情况下,进行所述累积合并操作。
12.根据权利要求9所述的装置,其特征在于,所述基本合并单元还用于:在所述累积合并操作生成的文件数大于等于预设的第二文件数阈值的情况下,进行所述基本合并操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711437794.8/1.html,转载请声明来源钻瓜专利网。