[发明专利]面向电力超算云资源自动扩展的智能化管理系统及方法在审
申请号: | 202310595008.6 | 申请日: | 2023-05-24 |
公开(公告)号: | CN116643844A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 粟海斌;刘珺;詹柱;刘斌;欧阳宏剑 | 申请(专利权)人: | 方心科技股份有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455;G06F9/50 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 唐芳 |
地址: | 410205 湖南省长沙市长沙高新开*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 电力 超算云 资源 自动 扩展 智能化 管理 系统 方法 | ||
1.一种面向电力超算云资源自动扩展的智能化管理系统,其特征在于,包括中心控制模块(10)、Prometheus服务监控和采集模块(20)、需求分析模块(30)、容量规划模块(40)和Kubernetes集群(50),其中,
所述中心控制模块(10)分别与所述Prometheus服务监控和采集模块(20)、所述需求分析模块(30)、所述容量规划模块(40)和所述Kubernetes集群(50)相连接,用于作为系统的中枢,统筹所述Prometheus服务监控和采集模块(20)、所述需求分析模块(30)和所述容量规划模块(40)的工作,并通过资源伸缩指令控制所述Kubernetes集群(50)中的业务容器数量;
所述Prometheus服务监控和采集模块(20),用于收集、处理和汇总服务的实时量化数据,并把收集来的数据存储在时序数据库中;
所述需求分析模块(30),用于查询可用的历史数据并检查性能质量参考指标,使用基于Transformer长序列预测模型捕获输入与输出之间的远程依赖,对未来负载进行有效预测;
所述容量规划模块(40)与所述需求分析模块(30)相连接,用于依据所述需求分析模块(30)的负载预测,估计在下一个扩展操作中应该调配或取消调配的资源数量;还用于优化资源的构成,在保证服务质量的同时,避免在资源调配的过程中发生抖动现象。
2.如权利要求1所述的面向电力超算云资源自动扩展的智能化管理系统,其特征在于,所述面向电力超算云资源自动扩展的智能化管理系统还包括负载均衡器(60),所述负载均衡器(60)与所述Kubernetes集群(50)相连接,由traefik构建,用于负载请求路由的分发。
3.一种面向电力超算云资源自动扩展的智能化管理方法,应用于如权利要求1和2任意一项所述的面向电力超算云资源自动扩展的智能化管理系统中,其特征在于,所述面向电力超算云资源自动扩展的智能化管理方法包括以下步骤:
配置和部署所述Prometheus服务监控和采集模块用于收集、处理和汇总服务的实时量化数据;
控制系统进入预热阶段,在预热阶段中使用所述Prometheus服务监控和采集模块将收集来的数据训练长序列预测模型,使其达到稳定的收敛状态;
所述中心控制模块在预热阶段后定期轮询时序数据库中可用的历史数据,并检查服务质量协议;
所述中心控制模块接收所述Prometheus服务监控和采集模块返回的时序数据;
所述中心控制模块将接收到的时序数据进行预处理后转发到所述需求分析模块;
所述需求分析模块接收到真实的历史数据后,对基于Transformer架构的预测模型进行滚动训练,并对未来的负载实施预测;
所述需求分析模块将负载预测序列和服务质量目标发送给所述容量规划模块;
所述容量规划模块在接收到负载预测值和服务质量目标后进行分析并实施服务实例数量的规划;
所述中心控制模块根据下一阶段服务所需的实例数量决定是否进行扩缩操作;
所述中心控制模块如果识别到实例的数量保持不变,则结束本周期并等待下一个周期;如果识别到需要扩缩资源,则所述中心控制模块向所述Kubernetes集群发送APIServer指令;
所述Kubernetes集群中的Master节点接收到信息后向Worker节点发送指令,以执行相应的服务实例数量的扩缩操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方心科技股份有限公司,未经方心科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310595008.6/1.html,转载请声明来源钻瓜专利网。