[发明专利]一种监控系统报警方法、监控系统和监控装置有效
申请号: | 201710022721.6 | 申请日: | 2017-01-12 |
公开(公告)号: | CN108306749B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 张一淳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 龙洪;栗若木 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监控 系统 报警 方法 装置 | ||
一种监控系统报警方法、监控系统和监控装置。监控系统检测到第一监控对象的第一监控指标满足第一报警规则中的报警条件;所述监控系统进行报警并向用户展示报警信息,所述报警信息包括所述第一监控指标的信息和不同于所述第一监控指标的第一关联指标的信息。监控装置包括存储程序代码的存储器和读取所述程序代码以执行报警处理的处理器。本申请在报警时除了向用户展示导致报警的监控指标之外,还向用户展示其他的关联指标,可以更好地展示报警现场,帮助用户快速定位问题、解决问题。
技术领域
本发明涉及监控技术,更具体地,涉及一种监控系统报警方法、监控系统和监控装置。
背景技术
监控系统可以采集和存储监控对象(如集群、主机、网卡、数据库等)的数据,通过分析、统计等处理得到相应的指标(如CPU使用率、网络流量、数据库中某个字段的取值、日志中的关键字等等),实时验证这些指标是否满足预期,如判定有指标不满足预期(也即该指标满足报警规则中的报警条件)时进行报警,例如报警规则规定主机的CPU使用率超过95%时进行报警,如果主机的CPU使用率达到98%,则判定该指标不符合预期或者说该指标满足报警规则中的报警条件而触发报警。本申请将用于报警判定的指标称为监控指标(也可称为监控项)。监控系统在报警时会向用户发送通知并展示报警信息。
在监控的场景下,目前业界收到的报警信息包括报警的时间和导致报警的监控指标。在相关的针对集群或服务的监控运维场景下,在集群或服务上设置了报警规则之后,实际监控时会对该集群的每台机器的每个指标进行分析和检查,如果有不满足预期的监控指标则发送报警,在报警信息中会向用户展示是哪个监控指标导致的报警,还会展示是哪个监控对象的该监控指标导致的报警。监控维度是确定导致报警的监控对象的定位信息,如监控维度配置为集群-主机-磁盘时,报警信息中会显示导致报警的监控指标属于哪个集群中哪个主机的哪个磁盘。
但是,上述监控系统的报警信息对于定位和解决问题是不够的。特别是在监控指标多,依赖复杂的场景,例如云计算领域的多个云产品融合构成的大规模系统中,上述监控系统的报警信息没有太大的作用。因为一个监控指标不符合预期有多种可能引起,用户通过报警信息并不能确定引起报警的真正问题。
例如,用户搭建了一个对外服务的站点,背后对应了多台服务器,还有负载均衡等设备。用户针对该网站首页的状态、网站请求量和访问响应时间添加了监控,传统监控系统报警的时候只会通知用户网站挂了,或者哪台机器的请求量暴跌、或者哪台机器的访问响应时间超长。然而导致网站挂了或请求量暴跌或访问响应时间超长的原因可能有多种,例如某一台或多台服务器宕机,相关的进程被杀掉了,网卡流量达到配额,负载均衡产品转发出错,用户依赖的存储产品故障等等。用户收到了报警之后还需要自己登陆服务器或云产品控制台去一步步排查问题,这就不可避免地浪费了很多时间,对正处于报警或故障中的用户非常不便的,而且用户排查时相应指标的数据可能已经发生变化,难以复现报警当时的场景而确定问题的所在。
如上所述,相关技术的监控系统报警方法存在以下主要问题:
报警信息中只是单一指标的展示,无法结合多个指标分析。例如用户设置了CPU使用率的报警,只能产生哪个集群哪个机器的CPU使用率超过阈值发生报警的报警信息,无法展现出系统负载,内存,进程,网络等其它配合排查问题的相关指标。用户也无法自定义自己感兴趣的展示指标。
报警信息中只是单一监控对象的展示,无法结合其他关联的对象分析。例如某一台机器的网站请求量暴跌时,只能给出该机器的相关指标,用户无法了解其他对象的状态如其他机器、负载均衡设备的情况,但该机器的网站请求量暴跌也可能是其他机器或负载均衡设备故障引起的。
此外,关技术的监控系统报警方法还存在一些其他问题,例如:
报警信息的展示格式固定,如只能通过文本方式展示,不方便用户直观地发现问题。
应用场景单调,只能处理集群/服务-主机-指标这样的监控报警场景,对应于云上复杂的场景,用户自定义的场景都无法满足。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710022721.6/2.html,转载请声明来源钻瓜专利网。