[发明专利]一种用于检测应用集群健康度的系统及方法在审
申请号: | 202011609759.1 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112749071A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 陈胜仇;吴海洋;吴倩;花卉;王玮;马德晶;周士成 | 申请(专利权)人: | 中国人寿保险股份有限公司上海数据中心 |
主分类号: | G06F11/34 | 分类号: | G06F11/34 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 丁云 |
地址: | 200131 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 检测 应用 集群 健康 系统 方法 | ||
本发明涉及一种用于检测应用集群健康度的系统及方法,所述的方法包括初始化待监控的应用集群信息;数据采集单元采集APM工具生成的性能数据,并存储至本地数据库;基线计算单元根据本地数据库中的历史时序性能数据,获取动态基线;异常检测单元对本地数据库中的实时性能数据进行异常检测;告警单元根据异常检测单元的异常检测结果判断应用集群的健康度,并发出告警信息。与现有技术相比,本发明基于数据采集单元、动态基线计算单元、异常检测单元、告警单元、任务调度单元和本地数据库,有效储存应用集群的APM数据,获取应用集群的健康度,提高对应用集群健康度检测的准确性和高效性,提高应用集群健康度检测的可靠性。
技术领域
本发明涉及应用集群健康度检测领域,尤其是涉及一种用于检测应用集群健康度的系统及方法。
背景技术
随着微服务架构的流行,越来越多的IT项目采用微服务架构进行开发。诚然微服务实现了模块间的解耦,同时以其独立部署、快速迭代等特性,满足了企业敏捷开发的要求。但随着服务模块的不断增加,服务间的调用也越来越复杂,我们急需应用服务调用链分析(以下简称APM)工具监控各个应用服务的调用情况及响应性能。
目前,比较常见的APM工具有Naver的Pinpoint、google的Dapper、twitter的Zipkin、淘宝的鹰眼、大众点评的CAT等。
虽然上述工具能很好的展示各个服务的性能以及服务之间的调用关系,同时可以根据用户自定义的阀值,对诸如交易缓慢数、报错数等指标进行告警。但仍存在以下不足:
1、部分指标告警阀值的设置依赖用户经验,无法科学设置;
2、根据不同时点业务压力的变化,部分性能指标会呈现动态变化的趋势,现有工具缺乏为此指标建立动态基线的能力;
3、常规的阈值告警对故障的容忍度较低,误报率较高。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种用于检测应用集群健康度的系统及方法。
本发明的目的可以通过以下技术方案来实现:
一种用于检测应用集群健康度的系统,包括数据采集单元、动态基线计算单元、异常检测单元、告警单元、任务调度单元和本地数据库,
所述的数据采集单元用于采集APM工具生成的性能数据,并存储至本地数据库,
所述的动态基线计算单元用于根据本地数据库中的历史时序性能数据,生成动态基线,
所述的异常检测单元用于本地数据库中的实时性能数据进行异常检测,并对实时数据打上正常标签或异常标签,
所述的告警单元根据异常检测单元的异常检测结果判断应用集群的健康度,并发出告警信息,
所述的本地数据库用于储存性能数据。
优选地,所述的系统还包括前端展示单元,所述的前端展示单元用于实时展示各应用集群指标的动态基线和健康度。
优选地,所述的系统还包括任务调度单元,用于统一管理数据采集、动态基线计算、告警轮询检查、数据归档等作业,并作为守护进程,保障所有计算模块的正常工作。
一种用于检测应用集群健康度的方法,基于上述的一种用于检测应用集群健康度的系统,包括以下步骤:
S1:初始化待监控的应用集群信息;
S2:数据采集单元采集APM工具生成的性能数据,并存储至本地数据库;
S3:基线计算单元根据本地数据库中的历史时序性能数据,获取动态基线;
S4:异常检测单元对本地数据库中的实时性能数据进行异常检测;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人寿保险股份有限公司上海数据中心,未经中国人寿保险股份有限公司上海数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011609759.1/2.html,转载请声明来源钻瓜专利网。