[发明专利]告警处理方法和系统有效
申请号: | 200910242252.4 | 申请日: | 2009-12-08 |
公开(公告)号: | CN102088363A | 公开(公告)日: | 2011-06-08 |
发明(设计)人: | 赵世杰;幸勇;庞然;宋振宇 | 申请(专利权)人: | 大唐移动通信设备有限公司;上海大唐移动通信设备有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L12/56 |
代理公司: | 北京市德恒律师事务所 11306 | 代理人: | 高雪琴 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 告警 处理 方法 系统 | ||
技术领域
本发明涉及告警处理方法和系统。
背景技术
告警通常分为两类:故障类告警和事件类告警,其中,故障类告警是重点关注的对象,准确性高且更直接,而事件类告警是故障类告警的辅助,数量比故障类告警多得多,二者的比例一般为10∶1。
告警是运营商正常运营情况下重点关注的模块,主要用于派单和问题定位,目前采用以故障类告警为基准,事件类告警做辅助参考的方式。
图1是示出基站子系统操作维护中心系统体系结构的示图。参照图1描述现有的告警流程:基站或无线网络控制器(radio network controller,简称为RNC)等网元产生一条告警,然后基站通过SNMP trap上报给协议网关,RNC通过TCP/IP上报给协议网关;协议网关将消息转换为统一的告警消息并上报给公共平台服务器;公共平台服务器转发告警消息给告警模块;告警模块应用规则(例如:相关性规则、延迟规则等)处理告警;以及告警模块发送消息给上级网管代理和图形用户接口(graphical userinterface,简称为GUI)。从图1中可以看出,与告警处理相关的部分主要是协议网关、服务层、公共服务平台。
告警规则是对告警的一些处理,能够加快告警的处理速度。例如,相关性规则是抑制衍生告警的一种有效方法,可以减少处理的告警数目,从而提高告警处理速度。
现有的告警处理流程在完整性和正确性方面没有问题,但是却不能满足运营商对告警处理的速度要求,尤其是在告警风暴条件下。具体缺点表现为如下几个方面:
事件类告警处理缺陷:事件类告警的特点是数目多,基本上是故障类告警的10倍,但反映设备故障方面又比故障类告警差,这些特点就会导致公共平台服务器转发消息的负荷较大,加重了网络的负荷,服务器处理告警过于频繁;
应对告警风暴能力有欠缺:告警风暴是在短时间内有大量的告警上报,在告警风暴的情况下,告警模块占用的系统内存就会疯长,消息队列严重堆积,从而导致告警处理时间被严重延迟,远远超过中移动规范要求的处理时间;以及
告警规则处理告警的速度慢:告警规则是在服务器层应用的,服务器层缓存的是所有网元的告警,而相关性规则等规则是针对具体网元的,这就造成告警规则相对于比较告警次数的浪费,即比较告警的条数比真正有用的比较多了很多倍,例如,如果网元个数是10,那就是10倍。
因此,需要一种能够提高处理速度的告警处理方法和系统。
发明内容
考虑到上述问题而做出本发明。
根据本发明的一个方面,提供了一种告警处理方法,包括以下步骤:步骤S202,判断上报的告警是事件类告警还是故障类告警;以及步骤S204,根据判断结果设置缓存队列。
一方面,如果在步骤S202中判断出上报的告警是事件类告警,则在步骤S204中,针对所有网元的告警设置一个缓存队列。
在这种情况下,在步骤S204之后,还包括以下处理:监控缓存队列的状态;如果缓存队列的长度大于预定长度或者缓存队列的缓存时间超过预定时间,则在一条消息中将缓存队列中的所有告警发送给服务器;以及服务器在接收到消息后将所有告警存入数据库。
优选地,根据网络规模和设备故障状态来确定预定长度和预定时间。
另一方面,如果在步骤S202中判断出上报的告警是故障类告警,则在步骤S204中,针对每一个网元的告警分别设置一个缓存队列。
在这种情况下,在步骤S204之后,还包括以下处理:在每一个缓存队列上设置告警相关性规则,并且在每当收到一条新告警后都将该新告警与该缓存队列中的所有告警进行比较。
此外,该方法还包括以下处理:配置感兴趣的网元,并对所述感兴趣的网元的缓存队列设置一个绿色通道线程池;以及对除感兴趣的网元的缓存队列之外的其他缓存队列设置一个常规线程池。
优选地,对绿色通道线程池提供2个线程。
优选地,常规线程池中的线程的数量少于网元的数量。
此外,如果特定网元的缓存队列发生告警风暴,则该方法还包括以下处理:如果该缓存队列中在预定时间内积累的告警的数量小于第一阈值,则以告警消息的形式上报给服务器;如果该缓存队列中在预定时间内积累的告警的数量大于第一阈值且小于第二阈值,则将缓存队列中的告警打包成文件,并以文件传输协议消息发送给服务器;以及如果该缓存队列中在预定时间内积累的告警的数量大于第二阈值,则向所述服务器上报特定网元存在告警风暴,同时监控该缓存队列的状态直到告警风暴结束,然后清空该缓存队列中的告警并向服务器上报风暴解除告警,服务器同步该特定网元的故障类活跃告警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大唐移动通信设备有限公司;上海大唐移动通信设备有限公司,未经大唐移动通信设备有限公司;上海大唐移动通信设备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910242252.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频编解码器及运动估计方法
- 下一篇:双电路或多电路放电装置