[发明专利]一种监控方法、系统及设备有效
申请号: | 201610212676.6 | 申请日: | 2016-04-07 |
公开(公告)号: | CN107276779B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 李兆伟;孙辉 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 王刚;龚敏 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监控 方法 系统 设备 | ||
本申请涉及一种监控方法、系统及设备。其中,监控方法包括:获取指定时间段的监控数据;基于所述监控数据,根据预设的报警触发条件进行报警监控。本发明实施例通过反映一段时间内疑似噪点集合的偏移和离散情况的偏离度stdr判断是否需要报警,避免了数据噪点导致的错误报警,从而有效减少了错误报警,提高了报警的准确性。
技术领域
本发明涉及通信领域,尤其涉及一种监控方法、系统及设备。
背景技术
在IT系统运维过程中,常常会监控各类系统指标,比如CPU、DISK I/O、NETWORK I/O、吞吐量等等。当有异常发生时,需要用报警的方式通知运维人员进行人为干预。
传统的监控报警方式是设定一个阈值,当系统指标超过该阈值时,会自动报警通知相应的系统运维人员。但是在云计算领域,由于普遍存在不同的用户和系统弹性共享硬件资源的情况,这一类指标的实际值在运行中常常会保持高频率的上下波动,这种“强波动性”的指标,偶尔会出现某个瞬间突然增高,立即又恢复正常。我们称这种突发的、短暂的异常数据为数据噪点,对于数据噪点,云计算的系统运维人员实际是不需要处理的,如果仍采用传统的阈值报警方式,就会出现错误报警的问题。
以关系型数据库的IOPS(Input/Output Operations Per Second,每秒读写操作的次数)的监控为例。IOPS是关系型数据库的一项非常重要的指标,运维人员需要持续关注,一旦达到极限,轻则会导致系统吞吐率下降,重则会导致系统挂断,停止提供服务。图1为OLTP(On-Line Transaction Processing,联机事务处理)类型的生产系统中关系型数据库的IOPS监控示意图。按照传统报警方式,设置一个阈值(threshold),假设设置的阈值为IOPS threshold=2000,一旦指标的某个瞬间值达到threshold即报警。当图1所示的首个脉冲出现时,系统会立即报警。但实际上,图1所示的首个脉冲只是一个数据噪点,从图1中看,IOPS指标只是偶尔超过阈值,此时的报警是错误报警。
按照传统的报警方式,如果阈值设置的偏低,错误报警的概率会很高;如果阈值设置的偏高,又容易遗漏报警,而且不管设置多高的阈值,都有错误报警的可能。
发明内容
本发明的目的在于提供一种监控方法、系统及设备,减少错误报警的概率,提高报警的准确性。
为实现上述目的,本发明提出了一种监控方法,应用于云计算平台,包括:
获取指定时间段的监控数据;
基于所述监控数据,根据预设的报警触发条件进行报警监控。
进一步地,上述方法还可具有以下特点,所述基于所述监控数据,根据预设的报警触发条件进行报警监控,包括:从所述监控数据中提取监控目标在时间段T内的采样数据集合,记为第一集合{xi},所述时间段T的终止时间点为当前时刻;
从所述第一集合中筛选出疑似噪点xj,所述疑似噪点指大于预设阈值th的采样数据,将疑似噪点集合记为第二集合{xj};
计算所述时间段T内疑似噪点的偏离度stdr,
其中,std为所述第一集合{xi}的标准差,M为所述第一集合{xi}中的数据个数,std′为所述第二集合{xj}的相对标准差,S为所述第二集合{xj}中的数据个数,为所述第一集合{xi}的平均值,
判断所述偏离度stdr是否符合预设的第一报警触发条件,所述第一报警触发条件为:所述偏离度stdr大于或等于预设的偏离度阈值;
根据所述第一报警触发条件的判断结果进行报警监控。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610212676.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种端口控制的方法和装置
- 下一篇:一种去除抗生素的生态有机肥的生产方法