[发明专利]基于多变量分组的服务器性能预测方法在审
申请号: | 201611213761.0 | 申请日: | 2016-12-26 |
公开(公告)号: | CN108241864A | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | R·W·马丁;张宏斌;曹健 | 申请(专利权)人: | 摩根士丹利服务集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李颖 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器性能 多变量 预测 时间序列 历史性能数据 时间序列信息 系统性能指标 企业服务器 分组 短期预测 多步预测 高度动态 高效分配 预测模型 资源共享 资源消耗 单变量 服务器 搜索 合成 转化 研究 | ||
本公开涉及基于多变量分组的服务器性能预测方法。本发明提出了一种用于多步预测企业服务器性能的方法。在高度动态的资源共享环境中,系统性能指标的准确预测是资源高效分配的关键。针对CPU负载等性能指标的预测,研究人员已提出一系列预测模型,但大部分集中在单变量和短期预测领域。该方法收集了服务器的历史性能数据,并且将其转化成多变量时间序列。在进行预测时,通过K近邻算法对历史的多变量时间序列进行搜索,找到与当前的服务器性能及资源消耗的状态最为接近的历史序列。将K个最相近的历史时间序列的后续时间序列信息合成未来服务器性能状况的预测值。
技术领域
本发明涉及信息技术领域中的多变量服务器负载预测方法。
背景技术
目前,已有许多研究通过时间序列预测算法对服务器性能进行预测。
这些研究有的使用了经典的线性回归、指数平滑或者ARIMA模型进行时间序列预测,也有的使用了更为复杂的支持向量机(SVM)、神经网络以及模糊逻辑算法。KNN算法也在时间序列预测中得到了使用。但是现有的服务器性能预测都是针对的单一指标,而忽略了实际中对多个指标预测的需求以及指标间的相关性;另一方面,这些预测针对的是下一步的数据,无法对未来多个步长的数据进行准确的预测。
发明内容
本发明的技术解决问题:
1.基于多维K近邻方法获取多步性能预测
通过多维K近邻方法能够预测多步性能信息,扩大了预测的范围。
2.通过维度分组提高预测速度
随着时间序列维度的增加,进行时间序列预测的速度会急剧下降。如果预测算法运行时间过长,则失去了实时预测的能力。通过变量分组提高了预测速度。
3.通过维度分组,保留了变量间的相关性
当多元时间序列的维度很多时,直接进行KNN预测反而由于变量之间的干扰而产生很大误差。通过维度分组,保留了变量间的相关性,又提高了速度。
本发明的技术解决方案:为了综合利用各个指标信息以提高预测的精度,本发明提出一种基于多变量分组的K最近邻算法的服务器性能预测方法。通过分析各变量间的相关性对变量进行分组,在此基础上利用K最近邻法搜索相似历史序列,进行多步预测。
本发明与现有技术相比的优点在于:
使用了多维K最近邻方法实现对服务器的多步性能预测。同时,将变量按相关性、依赖性进行分组,使得每个组内的变量联系密切,不同组的变量之间的相关度较低或相对独立。对变量进行分组在减少干扰提高预测精度的同时,还可以极大地降低多元时间序列的维度,从而加快KNN的搜索速度。
附图说明
图1 KNN算法示意图。
图2预测算法流程图。
图3是按照本发明的各实施例的企业计算机系统的框图。
具体实施方式
本发明分为以下步骤:
S1确定相关性矩阵
给定长度为T、维度为d的多变量时间序列,我们利用相关系数来衡量两个变量之间的关联程度。本专利选择斯皮尔曼秩相关系数(Spearman’s rank correlationcoefficient),它是一个度量两变量间联系强弱的非参数性质的秩统计参数。
对容量为n的样本,原始数据Xi,Yi被转换为等级数据xi,yi,相关系数ρXY为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于摩根士丹利服务集团有限公司,未经摩根士丹利服务集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611213761.0/2.html,转载请声明来源钻瓜专利网。