[发明专利]告警检测任务均衡调度的方法、装置、设备及可读介质在审
申请号: | 202110838283.7 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113626185A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张大帅 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F11/30 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛;宋薇薇 |
地址: | 250000 山东省济南市中国(山东)自由贸易*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 告警 检测 任务 均衡 调度 方法 装置 设备 可读 介质 | ||
本发明提供了一种集群告警检测任务均衡调度的方法、装置、设备及可读介质,该方法包括:获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。通过使用本发明的方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起CPU资源峰值占用。
技术领域
本领域涉及计算机领域,并且更具体地涉及一种集群告警检测任务均衡调度的方法、装置、设备及可读介质。
背景技术
本发明涉及到分布式存储集群相关的领域,分布式存储集群系统一般包含多台存储服务器(Server),这些服务器组成一个集群统一对外提供服务,文中也将服务器用“节点”表示,分布式集群一般都有其告警管理系统,需要定时检测集群节点上软硬件异常并进行告警,软硬件检测指标项比较多(包括系统资源利用率、集群各项服务及硬盘、电源、风扇等硬件设备状态),需要针对各个告警指标项单独建立检测任务线程,进行周期性检测指标项的状态。由于软硬件指标检测耗时和资源消耗不同,会造成任务线程分配不均,并且会引起不必要的系统资源开销。
发明内容
有鉴于此,本发明实施例的目的在于提出一种集群告警检测任务均衡调度的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够有效增加告警线程的利用效率,能够自适应任务线程资源占用限制,避免资源占用过高对系统中其他服务造成影响,能够避免引起CPU资源峰值占用。
基于上述目的,本发明的实施例的一个方面提供了一种集群告警检测任务均衡调度的方法,包括以下步骤:
获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类;
基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗;
响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低。
根据本发明的一个实施例,还包括:
获取每个告警检测任务的运行周期;
将具有相同运行周期的告警检测任务设置为在告警检测任务执行前在预设时间段内随机休眠后再进行执行。
根据本发明的一个实施例,预设时间段为1秒至30秒。
根据本发明的一个实施例,获取每个告警检测任务的耗时和资源消耗,并基于获取到的耗时和资源消耗将告警检测任务进行分类包括:
响应于告警检测任务的耗时超过1分钟和/或资源消耗大于30M物理内存,将告警检测任务分类为重量级检测任务;
响应于告警检测任务的耗时未超过1分钟且资源消耗不大于30M物理内存,将告警检测任务分类为轻量级检测任务。
根据本发明的一个实施例,基于告警检测任务的分类为每个告警检测任务分配工作线程数,并实时检测每个告警检测任务的资源消耗包括:
将执行告警检测任务的总线程数中的三分之二分配给重量级检测任务;
将执行告警检测任务的总线程数中其余的三分之一分配给轻量级检测任务。
根据本发明的一个实施例,响应于检测到有告警检测任务的资源消耗超过预设阈值,将该告警检测任务执行频率降低包括:
响应于检测到有告警检测任务的资源消耗超过CPU单核的50%,将该告警检测任务执行频率降低50%。
根据本发明的一个实施例,获取每个告警检测任务的耗时和资源消耗包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110838283.7/2.html,转载请声明来源钻瓜专利网。