[发明专利]一种分布式数据库中海量小文件的多级优化存储方法及系统有效
申请号: | 201610375410.3 | 申请日: | 2016-05-30 |
公开(公告)号: | CN105956183B | 公开(公告)日: | 2019-04-30 |
发明(设计)人: | 张华琛;高如超;卢乐书;陈振辉;雷通;黄琦 | 申请(专利权)人: | 广东电网有限责任公司电力调度控制中心;中国能源建设集团广东省电力设计研究院有限公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/182 |
代理公司: | 北京邦信阳专利商标代理有限公司 11012 | 代理人: | 张伟杰 |
地址: | 510600 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种分布式数据库中海量小文件的多级优化存储方法及系统,方法包括:分布式数据库的管理节点响应于包括至少一个小文件的小文件输入事件,将所述小文件放入合并队列,将每个合并队列所包括的小文件分别合并后得到合并文件并保存在分布式数据库的工作节点中,所述小文件的文件长度小于预设小文件长度阈值;分布式数据库的管理节点为每个所述合并文件所包括的每个小文件构建索引并保存在分布式数据库的管理节点中;客户端根据所述索引,从所述合并文件中获取所述小文件。本发明从HDFS的文件存取流程出发,使用合并队列算法将小文件合并为大文件,减少小文件数量,同时,构建索引提高文件检索性能。 | ||
搜索关键词: | 一种 分布式 数据库 海量 文件 多级 优化 存储 方法 系统 | ||
【主权项】:
1.一种分布式数据库中海量小文件的多级优化存储方法,其特征在于,包括:文件合并步骤,分布式数据库的管理节点响应于包括至少一个小文件的小文件输入事件,将所述小文件放入合并队列,将每个合并队列所包括的小文件分别合并后得到合并文件并保存在分布式数据库的工作节点中,所述小文件的文件长度小于预设小文件长度阈值;文件索引步骤,分布式数据库的管理节点为每个所述合并文件所包括的每个小文件构建索引并保存在分布式数据库的管理节点中;文件读取步骤,客户端根据所述索引,从所述合并文件中获取所述小文件;所述文件合并步骤,具体包括:小文件输入响应子步骤,分布式数据库的管理节点响应于包括至少一个小文件的小文件输入事件;小文件选择子步骤,选择所述小文件输入事件所包括的其中一个小文件作为当前小文件;长度比较子步骤,获取预设的合并队列组中所有合并队列的剩余长度,如果所述当前小文件的文件长度小于或等于所有合并队列的剩余长度的最大值,则将剩余长度大于或等于所述当前小文件的文件长度的合并队列作为当前合并队列,执行小文件加入子步骤,如果所述当前小文件的文件长度大于所有合并队列的剩余长度的最大值,则执行合并队列选择子步骤;合并缓冲选择子步骤,将剩余长度最小的合并队列作为待判断合并队列,如果所述待判断合并队列满足预设均衡合并条件,则将所述待判断合并队列所包括的小文件合并得到合并文件并保存在分布式数据库的工作节点后,清空所述待判断合并队列,将所述待判断合并队列作为当前合并队列,执行小文件加入子步骤,如果所述待判断合并队列不满足预设均衡合并条件,则从预设的缓冲队列组中选择一个缓冲队列作为当前合并队列,从缓冲队列组中移除并加入合并队列组,执行小文件加入子步骤;小文件加入子步骤,将所述当前小文件加入所述当前合并队列,如果所述小文件输入事件还包括其小文件,则执行小文件选择子步骤,否则将所述合并队列组中每个合并队列所包括的小文件分别合并后得到合并文件并保存在分布式数据库的工作节点中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司电力调度控制中心;中国能源建设集团广东省电力设计研究院有限公司,未经广东电网有限责任公司电力调度控制中心;中国能源建设集团广东省电力设计研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610375410.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种移动式络筒机加湿除尘装置
- 下一篇:一种新型立放式浴缸