[发明专利]一种预测式数据迁移方法及系统在审
申请号: | 201711046141.7 | 申请日: | 2017-10-31 |
公开(公告)号: | CN107728952A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 苏楠 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 数据 迁移 方法 系统 | ||
技术领域
本发明涉及存储技术领域,特别是涉及一种预测式数据迁移方法及系统。
背景技术
数据量的爆炸式增长以及数据类型的日益细化,让数据分级和冷热数据分治成为降低单位容量数据成本、提升数据存储效率和密度的有效方式。在企业的数据中心中,只有10%~15%的数据是被经常访问的,IOPS要求100k级别,剩余的则访问频率急剧下降,在10k甚至以下。
根据数据的访问需求,现有的方法会将读写频繁的数据放到缓存中或者高速存储区,例如SSD中,将读写不频繁的数据放到缓存或者低速存储区,例如HDD中。这种实现方式是为了使得对访问量多的数据尽快提供服务,对访问量少的数据无需提供过快的服务。
但是,这种以访问热度为统计量的方法在热度增长的初期不能很好的满足用户的需求,当热度增长到一定程度,才能触发数据的迁移。也许数据迁移后,原本热度很高的数据不再访问频繁了。经过一段时间的热度统计后,又要重新迁移。这种迁移方法不能很好的处理热度变化很快的情况,会导致迁移经常触发。
发明内容
有鉴于此,本发明的目的在于提供一种预测式数据迁移方法,可以有效减少迁移的开销,提高数据的访问速度。其具体方案如下:
一种预测式数据迁移方法,包括:
将不同时间段内的数据访问信息作为训练集,训练出预测模型;
根据所述预测模型,预测出待访问频繁的数据并迁移到高速存储区。
优选地,在本发明实施例提供的上述预测式数据迁移方法中,根据所述预测模型,预测出待访问频繁的数据并迁移到高速存储区,具体包括:
根据所述预测模型,计算出数据访问热度;
根据计算出的所述数据访问热度,将预测到的热度高的数据迁移到高速存储区;所述预测到的热度高的数据为待访问频繁的数据。
优选地,在本发明实施例提供的上述预测式数据迁移方法中,在将预测到的热度高的数据迁移到高速存储区之后,还包括:
若迁移到所述高速存储区的数据在设定时间内不是访问频繁的数据,则标记为访问不频繁,并降低所述预测模型的权重;
若迁移到所述高速存储区的数据在设定时间内是访问频繁的数据,则增加所述预测模型的权重。
优选地,在本发明实施例提供的上述预测式数据迁移方法中,在降低所述预测模型的权重之后,还包括:
通过定时器定时确定所述预测模型的权重;
若所述预测模型的权重低于设定阈值时,则按照设定的百分比调整所述训练集,重新训练所述预测模型;
若所述预测模型的权重不低于设定阈值时,则所述预测模型准确。
优选地,在本发明实施例提供的上述预测式数据迁移方法中,在将预测到的热度高的数据迁移到高速存储区之前,还包括:
判断高速存储区是否被占满;
若是,则将预测到的热度低的数据迁出所述高速存储区并迁移到低速存储区。
优选地,在本发明实施例提供的上述预测式数据迁移方法中,将不同时间段内的数据访问信息作为训练集,训练出预测模型,具体包括:
使用机器学习的方法将不同时间段内的数据访问信息作为训练集,训练出预测模型。
本发明实施例还提供了一种预测式数据迁移系统,包括:
模型训练模块,用于将不同时间段内的数据访问信息作为训练集,训练出预测模型;
数据迁移模块,用于根据所述预测模型,预测出待访问频繁的数据并迁移到高速存储区。
优选地,在本发明实施例提供的上述预测式数据迁移系统中,所述数据迁移模块,具体包括:
计算单元,用于根据所述预测模型,计算出数据访问热度;
迁移单元,用于根据计算出的所述数据访问热度,将预测到的热度高的数据迁移到高速存储区;所述预测到的热度高的数据为待访问频繁的数据。
优选地,在本发明实施例提供的上述预测式数据迁移系统中,还包括:
数据判断模块,用于若迁移到所述高速存储区的数据在设定时间内不是访问频繁的数据,则标记为访问不频繁,并降低所述预测模型的权重;若迁移到所述高速存储区的数据在设定时间内是访问频繁的数据,则增加所述预测模型的权重。
优选地,在本发明实施例提供的上述预测式数据迁移系统中,还包括:
权重确定模块,用于通过定时器定时确定所述预测模型的权重;若所述预测模型的权重低于设定阈值时,则按照设定的百分比调整所述训练集,重新训练所述预测模型;若所述预测模型的权重不低于设定阈值时,则所述预测模型准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711046141.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:独居石的阴极发光成像方法
- 下一篇:一种倾斜的钢筋混凝土板抗火试验装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置