[发明专利]一种监控系统的事件预警及防风暴策略的实现方法无效
申请号: | 201010579293.5 | 申请日: | 2010-12-08 |
公开(公告)号: | CN102034148A | 公开(公告)日: | 2011-04-27 |
发明(设计)人: | 宋智强;武志强 | 申请(专利权)人: | 山东浪潮齐鲁软件产业股份有限公司 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种监控系统的事件预警及防风暴策略的实现方法,通过制定一套服务策略来实现最终事件的权重分级和采用告警合并以及监控策略规则来防止风暴的产生,包括以下内容:1)由数据采集器对于具体指标的数据进行采集;2)采集之后的数据经过服务策略分析形成不同级别的告警事件;3)为了保证告警事件不进行重复产生,在缓存中进行了告警合并处理;4)告警合并处理之后的告警信息再进一步经过健康策略分析之后形成最终需要的事件,发送到事件流程进行处理。 | ||
搜索关键词: | 一种 监控 系统 事件 预警 风暴 策略 实现 方法 | ||
【主权项】:
一种监控系统的事件预警及防风暴策略的实现方法,其特征在于,通过制定一套服务策略来实现最终事件的权重分级和采用告警合并以及监控策略规则来防止风暴的产生,包括以下内容:1)由数据采集器对于具体指标的数据进行采集;2)采集之后的数据经过服务策略分析形成不同级别的告警事件;3)为了保证告警事件不进行重复产生,在缓存中进行了告警合并处理;4)告警合并处理之后的告警信息再进一步经过健康策略分析之后形成最终需要的事件,发送到事件流程进行处理;指标根据定义的采集指标内容进行采集,针对日常运维管理中主要关注的基础设施运行状况信息进行设定,保证采集数据的有效性;采集过来的数据经过服务策略分析,在这里定义了相关的服务策略,设定了不同程度的阈值权值;通过阈值分析之后的指标真正决定是否产生告警,如果认为属于告警范围将进行告警的合并处理,主要看当前指标是否一直处于告警状态,相同的指标如果一直在持续将认为是同一次告警;健康策略分析是对告警进行相应的规则处理,处理之后的告警才会真正形成一条事件,这条事件最终会跟事件流程对接;具体实现内容如下:指标数据采集指标是通过采集器进行采集的,作为企业IT环境基础设施的原始数据,这些基础设施的稳定运行将是企业日常生产运行的最根本保障;指标的设定往往是根据服务管理的好坏来设定,对于日常运维管理比较常用的指标进行采集,采集的指标要保证实效性;服务策略分析通过采集器采集的指标是比较原始的信息,我们要对每个指标产生的告警级别进行划分并设定权重值,设定紧急度、影响度;不同的紧急度和影响度将提示管理人员采取不同的轻重缓急措施;告警合并处理如果故障长时间未解决,可能会引起告警风暴,大量同类的告警数据充斥屏幕让人不厌其烦,给查看和分析其他告警增加了难度,要预防告警风暴,可以通过在告警中设置计数器和状态字段,把同类的告警划为一个,计数器增加同时改变状态,这样既不影响其他告警的展现,又能看到告警发生的次数,现在是根据条件表中的紧急度影响度与优先级作为一个判断依据,来区分同一个指标的告警是否可以归结为同一个告警,避免同样的告警多次出现;处理办法:使用一个容器作为告警的缓存,把生成的告警根据指标与优先级等作为主键添加到缓存中,在把对象添加到缓存中的同时,会赋一个时间戳的值,后面可以通过这个时间戳判断缓存中的告警是否已经超时;对新生成的告警,根据指标名称与优先级等组合键在缓存中查找是否有同类告警,然后依据查找的结果做出不同的操作;1)找到同优先级告警:更新原告警的状态为持续,计数器加一;2)找到低优先级告警:更新原告警的状态为升级,计数器加一;3)找到高优先级告警:更新原告警的状态为关闭;4)插入新的告警:把原告警从缓存中删除,把新告警添加到缓存中;5)未找到目标告警:插入新的告警,把告警添加到缓存中;通过上述步骤处理后,把重复出现的同一类告警合并为同一个告警,进而有效的避免了告警风暴的产生;健康策略分析经过上述一系列处理,认为还不能为最终进入管理流程的事件,要形成时间还需要经过一套规则引擎处理,下面制定几种规则分别是:1)逻辑型规则:用于判断多个事件以何种条件发生将意味着故障的发生;2)算术型规则:用于判断多个事件的值满足何种算数条件意味着故障发生,这种判断规则对于业务稽核非常重要,因为电信行业中,业务规则的稽核,往往意味着许多数值之间遵循特定的配平关系;3)次数型规则:用于判断事件是否频繁发生达到特定的次数;4)时间型规则:用于判断事件是否发生在特定的时间段,或者事件持续告警超过特定的时长;事件关联分析/业务稽核引擎识别以上规则的任意组合,同时,还允许在已经定义的故障的基础上,定义告警之间的多种关联规则。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮齐鲁软件产业股份有限公司,未经山东浪潮齐鲁软件产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010579293.5/,转载请声明来源钻瓜专利网。
- 上一篇:基于条形码的小额支付系统
- 下一篇:双轨道平面输送喷砂装置
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理