[发明专利]一种基于周期性特征分析的在线负载资源预测方法有效
申请号: | 201910592018.8 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110297715B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 梁毅;苏超;丁毅;丁振兴;李硕;苏航 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 周期性 特征 分析 在线 负载 资源 预测 方法 | ||
本发明公开了一种基于周期性特征分析的在线负载资源预测方法,在线负载资源预测方法分为三个步骤,资源序列周期识别、子序列分类、在线负载资源预测方法构建。本方法针对在线负载在运行过程中资源使用量具有明显的周期性特征,收集在线负载资源序列样本,对资源序列进行周期识别以及资源序列划分;其次,对于划分得到的子序列进行相似度计算并分类;然后,采用加权方式计算在线负载资源需求进行预测,本方法实现了基于周期性的在线负载资源预测。
技术领域
本发明属于大数据领域,具体涉及大数据在线负载资源的周期性分析和预测方法。
背景技术
负载是运行在数据中心的具体实例,是数据中心资源消耗的实际主体。在线负载是指以Web应用、流式计算为代表的、面向并发终端用户的常驻型服务所形成的计算负载,也是数据中心的主要负载之一。在线负载具有的特点是时效性强,对延迟敏感。内存和CPU是影响在线负载性能的重要资源。在线负载具有波动性,其资源使用量随着请求/数据到达强度的不同而产生波动。面向在线负载波动性特征,准确预测负载的资源需求,是保证在线负载资源充足和服务质量的前提下,提高数据中心资源利用率的关键。
既有数据中心在线负载的资源使用情况具有明显的周期性特征。然而,目前大数据在线负载的资源预测方法并未结合资源使用的周期性特征对在线负载资源进行预测,这使得既有的在线负载资源预测方法存在如下问题:
(1)无法在样本数据量较少的情况下对在线负载进行资源进行准确预测。既有在线负载资源预测方法主要是时间序列分析法和机器学习相关算法,而这两种预测方法的准确度都依赖于大规模的历史样本数据。
(2)预测过程中的时间开销较大。由于现有的在线负载资源预测方法没有进一步探究资源使用的特征,所以,每一次预测都需要通过对所有样本数据进行训练和建模。随着在线负载资源样本数据的不断扩大,预测过程中的时间开销会越来越大,降低了预测效率。
综合而言,目前的研究中尚未存在基于周期性分析的在线负载资源预测方法。
发明内容
针对上述问题,本发明提出了一种基于周期性识别的在线负载的资源预测方法。本发明首先对在线负载的内存和CPU使用量的周期值进行计算,并根据周期值对资源使用序列进行划分;然后对经过划分得到的子序列进行相似性计算并根据度量结果将其分为常规序列和异常序列;最终结合常规序列和异常序列的资源使用信息计算出最终的资源使用量预测值。
本发明所述的在线负载的资源预测方法主要分为四个步骤:资源序列周期识别、子序列分类、在线负载资源预测和预测条件判断。
上述方法在计算机上按照以下步骤实现:
(1)资源序列周期识别:
1.1)收集在线负载资源使用序列,采用固定时间步长,从在线负载资源使用序列L中采样数据,构建时间序列ML={ml1,ml2,···mlp},其中mlj表示第j个时间点对应的资源使用量,p为采样总量。
1.2)自相关函数是信号领域用户周期性检测的常用方法,根据自相关函数公式(1)计算出序列ML的自相关序列MR={mr1,mr2,···mrn}。
其中,N是有限长的离散序列y的长度,x表示元素下标,k表示自变量。
1.3)对MR中任意两个相邻的两个极大值,依据其发生的时间点,计算它们的时间距离t_maxi。
1.4)计算所有t_maxi的均值,将该均值设定为资源使用量序列的周期T。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910592018.8/2.html,转载请声明来源钻瓜专利网。