[发明专利]一种用于检测应用集群健康度的系统及方法在审
申请号: | 202011609759.1 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112749071A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 陈胜仇;吴海洋;吴倩;花卉;王玮;马德晶;周士成 | 申请(专利权)人: | 中国人寿保险股份有限公司上海数据中心 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 丁云 |
地址: | 200131 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 检测 应用 集群 健康 系统 方法 | ||
1.一种用于检测应用集群健康度的系统,其特征在于,包括数据采集单元、动态基线计算单元、异常检测单元、告警单元、任务调度单元和本地数据库,
所述的数据采集单元用于采集APM工具生成的性能数据,并存储至本地数据库,
所述的动态基线计算单元用于根据本地数据库中的历史时序性能数据,生成动态基线,
所述的异常检测单元用于本地数据库中的实时性能数据进行异常检测,并对实时数据打上正常标签或异常标签,
所述的告警单元用于根据异常检测单元的异常检测结果判断应用集群的健康度,并发出告警信息,
所述的本地数据库用于储存性能数据。
2.根据权利要求1所述的一种用于检测应用集群健康度的系统,其特征在于,所述的系统还包括前端展示单元,所述的前端展示单元用于实时展示各应用集群指标的动态基线和健康度。
3.一种用于检测应用集群健康度的方法,其特征在于,基于权利要求1所述的一种用于检测应用集群健康度的系统,包括以下步骤:
S1:初始化待监控的应用集群信息;
S2:数据采集单元采集APM工具生成的性能数据,并存储至本地数据库;
S3:基线计算单元根据本地数据库中的历史时序性能数据,获取动态基线;
S4:异常检测单元对本地数据库中的实时性能数据进行异常检测;
S5:告警单元根据异常检测单元的异常检测结果判断应用集群的健康度,并发出告警信息。
4.根据权利要求3所述的一种用于检测应用集群健康度的方法,其特征在于,所述的步骤S1具体包括:
S101:同步已接入APM工具的应用集群信息;
S102:判断是否建立动态基线,若是进入步骤S2,否则返回步骤S101。
5.根据权利要求3所述的一种用于检测应用集群健康度的方法,其特征在于,所述的步骤S2具体包括:
S201:获取APM数据源;
S201:对APM数据源进行切片统计,获取数据切片;
S202:根据数据切片获取组织关键性能指标数据;
S203:将组织关键性能指标数据存储至本地关系数据库。
6.根据权利要求3所述的一种用于检测应用集群健康度的方法,其特征在于,所述的步骤S3具体包括:
S301:使用python pandas模块从本地数据库读取历史时序性能数据;
S302:将历史时序性能数据格式转为Dataframe;
S303:判读历史时序性能数据是否存在异常数据,若是,则剔除异常数据并进入S304,否则直接进入步骤S304;
S304:计算历史时序性能数据中每天相同时点的均值和方差,根据历史数据中每天相同时点的均值和方差生成动态基线;
S305:将动态基线写入数据库。
7.根据权利要求6所述的一种用于检测应用集群健康度的方法,其特征在于,所述的步骤S304中在历史时序性能数据的均值上加2倍方差生成动态基线最大值,在历史时序性能数据的均值上减2倍方差生成动态基线最小值。
8.根据权利要求3所述的一种用于检测应用集群健康度的方法,其特征在于,所述的步骤S4具体包括:
S401:获取本地数据库中的实时性能数据;
S402:判断实时性能数据是否满足异常规则,若是,对实时性能数据打上异常标签,并写入本地数据库,进入步骤S6,否则,进入步骤S403;
S403:根据异常检测算法判断性实时性能数据是否异常,若是,对实时性能数据打上异常标签,并写入本地数据库,否则对实时性能数据打上正常标签,写入本地数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人寿保险股份有限公司上海数据中心,未经中国人寿保险股份有限公司上海数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011609759.1/1.html,转载请声明来源钻瓜专利网。