[发明专利]一种面向存储系统的突发访问行为的预测方法及装置有效
申请号: | 201510426732.1 | 申请日: | 2015-07-20 |
公开(公告)号: | CN105094986B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 邓玉辉;黄立锋 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈燕娴 |
地址: | 510632 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 存储系统 突发 访问 行为 预测 方法 装置 | ||
1.一种面向存储系统的突发访问行为的预测方法,其特征在于:所述方法包括以下步骤:
S1、取存储系统的I/O数据集一部分作为训练集,对训练集进行频繁关联I/O的挖掘;
S2、以指定预测时间为时间粒度对存储系统的I/O数据集的测试集进行划分,并获取测试集所对应预测时间点的I/O请求总数;
S3、提取每个预测时间点的指定观察时间中的I/O请求数据,对每个观察时间点的I/O请求数据进行过滤,使每个观察时间点的频繁关联I/O被过滤,保留每个观察时间点的非频繁关联I/O;
S4、采用每个观察时间点的非频繁关联I/O判断对应的预测时间点是否发生突发访问行为,具体为:
若每个观察时间点的非频繁关联I/O达到观察阈值,则判断对应的预测时间点的I/O请求总数会超过突发阈值,即对应的预测时间点发生突发访问行为;否则,对应的预测时间点没有发生突发访问行为;其中,所述观察阈值是指预测突发访问行为发生时10秒内的I/O请求数的取值,所述突发阈值是指突发访问行为发生时所应该达到的请求数。
2.根据权利要求1所述的一种面向存储系统的突发访问行为的预测方法,其特征在于:步骤S1中,所述对训练集进行频繁关联I/O的挖掘采用基于关联强化窗口的Apriori算法实现,所述基于关联强化窗口的Apriori算法是指:
在传统Apriori算法基础上,在处理算法的第三步,即在扫描数据库进行候选集与整个数据集匹配,统计出候选集的支持度并删除不符合要求的候选集时,引入了关联强化窗口。
3.根据权利要求2所述的一种面向存储系统的突发访问行为的预测方法,其特征在于:所述关联强化窗口用于限定I/O数据块的数据量,具体为:
用于限定一段时间,然后采用动态变化的步长依次往后移动进行候选频繁I/O数据块序列的匹配。
4.根据权利要求2所述的一种面向存储系统的突发访问行为的预测方法,其特征在于:采用基于关联强化窗口的Apriori算法对训练集进行挖掘,得到的频繁关联I/O为最符合80/20规则以及满足时间开销阈值的频繁关联I/O。
5.根据权利要求1所述的一种面向存储系统的突发访问行为的预测方法,其特征在于:所述预测时间指定为30秒,所述观察时间指定为预测时间的前10秒。
6.根据权利要求1所述的一种面向存储系统的突发访问行为的预测方法,其特征在于:所述方法还包括:
S5、计算得出步骤S4预测中捕获突发访问行为的命中率和突发访问行为的发生率。
7.根据权利要求6所述的一种面向存储系统的突发访问行为的预测方法,其特征在于:步骤S4中,所述采用每个观察时间点的非频繁关联I/O判断对应的预测时间点是否发生突发访问行为,存在以下四种情况:
a、观察时间点的非频繁关联I/O达到观察阈值时,对应的预测时间点发生了突发访问行为;
b、观察时间点的非频繁关联I/O达到观察阈值时,对应的预测时间点没有发生突发访问行为;
c、观察时间点的非频繁关联I/O没有达到观察阈值时,对应的预测时间点发生了突发访问行为;
d、观察时间点的非频繁关联I/O没有达到观察阈值时,对应的预测时间点没有发生突发访问行为;
所述捕获突发访问行为的命中率,指的是情况a占情况a和情况c总数的比例;
所述突发访问行为的发生率,指的是情况a占情况a和情况b总数的比例。
8.一种面向存储系统的突发访问行为的预测装置,其特征在于:所述装置包括:
关联挖掘模块,用于取存储系统的I/O数据集一部分作为训练集,对训练集进行频繁关联I/O的挖掘;
关联过滤模块,用于以指定预测时间为时间粒度对存储系统的I/O数据集的测试集进行划分,并获取测试集所对应预测时间点的I/O请求总数;然后提取每个预测时间点的指定观察时间中的I/O请求数据,对每个观察时间点的I/O请求数据进行过滤,使每个观察时间点的频繁关联I/O被过滤,保留每个观察时间点的非频繁关联I/O;
突发预测模块,用于采用每个观察时间点过滤后得到的非频繁关联I/O判断对应的预测时间点是否发生突发访问行为,具体为:
若每个观察时间点的非频繁关联I/O达到观察阈值,则判断对应的预测时间点的I/O请求总数会超过突发阈值,即对应的预测时间点发生突发访问行为;否则,对应的预测时间点没有发生突发访问行为;其中,所述观察阈值是指预测突发访问行为发生时10秒内的I/O请求数的取值,所述突发阈值是指突发访问行为发生时所应该达到的请求数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510426732.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于芯片的安全检测方法和系统
- 下一篇:一种定位图片系统及方法