[发明专利]基于聚类和注意力机制的集群负载预测方法及系统有效
申请号: | 202110944222.9 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113762356B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 吴维刚;亓文康 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F18/23 | 分类号: | G06F18/23;G06F18/214;G06F9/50;G06F9/48 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 集群 负载 预测 方法 系统 | ||
本发明提出一种基于聚类和注意力机制的集群负载预测方法及系统,包括获取计算机集群的离散时间序列,将离散时间序列分为训练集和测试集;通过聚类算法,将计算机集群的离散时间序列分成k类;基于注意力机制,设置k个成对的本类编码器和本类解码器,以及全局编码器,并对k个成对的本类编码器和本类解码器,以及全局编码器进行训练;将聚类后的测试集的离散时间序列输入到训练好的本类编码器和全局编码器中得到相应的注意力序列表示,再将本类编码器和全局编码器分别输出的注意力序列拼接后,输入本类解码器中,得到集群负载预测结果。本发明提高了模型预测的精度,避免了计算资源损耗较高的缺陷,有助于集群更好的调度任务以提升资源利用率。
技术领域
本发明涉及计算机集群资源管理领域,更具体地,涉及一种基于聚类和注意力机制的集群负载预测方法及系统。
背景技术
随着计算机技术的不断发展,对于计算机用户的应用,要保证功能上的完整,获取更好的资源利用率以及提升集群的运算能力并减少成本、增加利润,集群需要对这些应用进行高效的分配。集群分配算法需要未来的计算机资源负载作为决策依据,因此需要对未来的资源负载进行有效的预测。近年来,一些基于注意力机制的预测方法能较好地捕捉时间序列的中长期特征,又能高效得到未来一段时间的预测结果,适用于集群负载的预测任务。但是,基于注意力机制的算法往往有着较高的时间复杂度和空间复杂度。如果对每台机器训练并使用一个此类模型用以负载预测,会造成较高的计算资源损耗。
解决部署大量模型损耗资源的一种方法是对时间序列进行聚类。公开号为CN108415777A(公开日为2018-08-17)提出一种基于聚类特征提取的云计算集群任务负载预测方法,包括如下步骤:调取并分析云集群数据服务器的历史负载数据,通过聚类算法将相似的历史负载曲线聚合到一个类别中,从而形成K个历史负载曲线聚类;对所述K个历史负载曲线聚类进行分析;采集用户提交的任务一定时间内的初始负载数据,选取DTW距离最短的历史负载曲线聚类为初始负载数据所属的聚类;从初始负载数据所属的聚类中选取与初始负载数据最为接近的历史负载曲线,作为负载预测的依据;通过所述与初始负载数据最为接近的历史负载曲线在所述一定时间区间的负载数据,预测用户提交任务在未来时间区域内的负载。降低云计算服务资源的浪费。然而,上述方法聚类后训练的模型只能获取本类内部时序的信息,会导致预测精度的下降。
发明内容
本发明为克服上述现有技术预测精度不理想和计算资源损耗较高的缺陷,提供一种基于聚类和注意力机制的集群负载预测方法及系统。
为解决上述技术问题,本发明的技术方案如下:
第一个方面,本发明提出一种基于聚类和注意力机制的集群负载预测方法,包括以下步骤:
S1:获取计算机集群的离散时间序列,将离散时间序列分为训练集和测试集;
S2:通过聚类算法,将计算机集群的离散时间序列分成k类;
S3:基于注意力机制,设置k个成对的本类编码器和本类解码器,以及全局编码器;将k类离散时间序列全部输入全局编码器中进行训练,每个类的本类编码器采用本类内的离散时间序列进行训练;全局编码器和本类编码器训练完成后,将全局编码器和本类编码器的输出拼接起来,再输入到相应的本类解码器中进行训练;
S4:将聚类后的测试集的离散时间序列输入到训练好的本类编码器和全局编码器中得到相应的注意力序列表示,再将本类编码器和全局编码器分别输出的注意力序列拼接后,输入相应的本类解码器中,得到集群负载预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110944222.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吸附式搬运装置
- 下一篇:一种轻量型平行轴线齿轮副机构