[发明专利]数据转存方法、装置和数据管理服务器有效
申请号: | 201811165916.7 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109144791B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 关海南 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 转存 方法 装置 数据管理 服务器 | ||
本发明提供了一种数据转存方法、装置和数据管理服务器,涉及大数据技术领域,其中,该方法包括:获取第一数据存储集群中数据的访问频率;根据访问频率确定数据是否需要转存;在确定需要转存的情况下,将数据从第一数据存储集群转存至与访问频率相匹配的级别的数据存储集群。本发明依据数据的访问频率确定数据的转存策略,能够在降低大数据存储成本的同时,更加合理地分布存储数据,保证高访问热度的数据能够被快速访问,从而提高了大部分用户的数据访问体验度。
技术领域
本发明涉及大数据技术领域,尤其是涉及一种数据转存方法、装置和数据管理服务器。
背景技术
在大数据领域内,数据调度是一种基本需求。例如,在进行数据备份时,把数据从高级别的数据存储集群复制到低级别的数据存储集群,以防止数据误删。由于高级别的数据存储集群的存储成本较高,为了整体上降低数据存储成本,将部分数据从高级别的数据存储集群转存至低级别的数据存储集群。
相关方式中,根据数据的保存时间确定数据的转存策略。通常,数据新生成时往往存储在高级别的数据存储集群,由于高级别的数据存储集群空间有限且成本较高,如果某些数据存储时间较长,则会将这些数据转存至低级别的数据存储集群。但这种转存策略欠缺一定的合理性,具体而言,由于低级别的数据存储集群的访问速度较慢,如果将存储时间较长、但用户经常访问的数据转存至较低级别的数据存储集群,易导致数据访问速度很慢,从而降低了用户的数据访问体验度。
发明内容
有鉴于此,本发明的目的在于提供一种数据转存方法、装置和数据管理服务器,以在降低大数据存储成本的同时,更加合理地分布存储数据,从而提高大部分用户的数据访问体验度。
第一方面,本发明实施例提供了一种数据转存方法,该方法应用于数据管理服务器;该方法包括:获取第一数据存储集群中数据的访问频率;根据访问频率确定数据是否需要转存;在确定需要转存的情况下,将数据从第一数据存储集群转存至与访问频率相匹配的级别的数据存储集群。
在本发明较佳的实施例中,上述根据访问频率确定数据是否需要转存,包括:判断访问频率是否在访问频率范围内;其中,访问频率范围与第一数据存储集群的级别对应;在访问频率不在访问频率范围内的情况下,确定数据需要转存。
在本发明较佳的实施例中,上述将数据从第一数据存储集群转存至与访问频率相匹配的级别的数据存储集群,包括:在访问频率低于访问频率范围的下限值的情况下,将数据转存至级别低于第一数据存储集群的级别的数据存储集群中;在访问频率高于访问频率范围的上限值的情况下,将数据转存至级别高于第一数据存储集群的级别的数据存储集群中。
在本发明较佳的实施例中,上述在将数据转存至低于第一数据存储集群的级别的数据存储集群中之前,方法还包括:在数据为原始数据的情况下,对数据进行压缩处理,得到压缩后的数据;在将数据转存至高于第一数据存储集群的级别的数据存储集群中之前,方法包括:在数据为压缩数据的情况下,对数据进行解压处理,得到解压后的数据。
在本发明较佳的实施例中,上述如果数据中包含多个文件,将数据转存至级别低于第一数据存储集群的级别的数据存储集群中之前,方法还包括:判断数据的多个文件中是否存在文件数据量小于预设的数据量阈值的文件;在存在的情况下,对文件数据量小于数据量阈值的文件进行合并处理,得到处理后的数据。
在本发明较佳的实施例中,上述将数据转存至级别低于第一数据存储集群的级别的数据存储集群中,包括:确定数据的待转存的数据存储集群的级别;从预设的数据血缘关系中查找数据是否存在依赖数据;在存在依赖数据的情况下,判断依赖数据所处的数据存储集群的级别是否低于或等于待转存的数据存储集群的级别;在确定依赖数据所处的数据存储集群的级别低于或等于第一数据存储集群的级别的情况下,将数据转存至待转存的数据存储集群中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811165916.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置