[发明专利]一种基于核密度估计调用链的根因定位方法及系统在审
申请号: | 202110799721.3 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113657715A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 李立泓;闫二乐;郑康秋;林诚汉;陈立峰;林俊德 | 申请(专利权)人: | 福建新大陆软件工程有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/18;G06N5/00 |
代理公司: | 福州市鼓楼区京华专利事务所(普通合伙) 35212 | 代理人: | 林燕 |
地址: | 350000 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密度 估计 调用 定位 方法 系统 | ||
本发明提供了计算机技术领域的一种基于核密度估计调用链的根因定位方法及系统,方法包括:步骤S10、采集各业务服务的可用性指标、KPI指标,各调用链上各业务服务之间的响应时间、成功率指标;步骤S20、基于设定的阈值对可用性指标进行监测;步骤S30、基于核密度估计,将调用链的KPI指标转换为节点异常分数,将调用链的响应时间以及成功率指标转换为节点边异常分数;步骤S40、将节点异常分数以及节点边异常分数加载到I T系统的静态拓扑图,得到故障传播图;步骤S50、利用随机游走算法对所述故障传播图进行随机游走,定位产生故障的节点以及KPI指标。本发明的优点在于:极大的提升了根因定位效率,极大的降低了I T系统的运维成本。
技术领域
本发明涉及计算机技术领域,特别指一种基于核密度估计调用链的根因定位方法及系统。
背景技术
随着信息技术的发展和众多系统的云化,IT架构已经从前后端分离,变成了分布式、微服务、DDD这些复杂的架构。如今,大规模的IT系统通常包含成千上万个应用,这些IT系统是高度动态和复杂的,IT系统中的一个业务服务包含几个至几千个实例,分别运行在不同的容器或者不同的服务器上,而这些实例的可用性就变成了大规模的IT系统需要面对的一个关键挑战。
在分布式、微服务、DDD这些架构下,一个完整的业务请求(业务服务)包含多个服务单元,各个业务系统和服务单元存在互相调用的情况,形成一个调用链,而调用链上的任何异常都可能沿着调用链进行传播,最终导致业务请求无法执行,这也是大规模的IT系统普遍遇到的问题。由于业务请求无法执行将直接影响用户体验和企业的利益,运维工程师需要在业务请求所在的每台主机上监控服务级别的KPI(例如响应时间)和主机级别的KPI(例如CPU使用情况)。当业务请求失败时,运维工程师必须尽快定位到产生故障的机器(根本原因/根因),并快速解决故障。
针对根因的定位,传统上采用运维工程师手动排查故障的方式,但由于IT系统存在服务复杂的调用关系,且指标众多,运维工程师难以通过众多服务和指标里快速定位到问题,导致根因定位的效率低下。
因此,如何提供一种基于核密度估计调用链的根因定位方法及系统,实现提升根因定位效率,降低IT系统的运维成本,成为一个亟待解决的问题。
发明内容
本发明要解决的技术问题,在于提供一种基于核密度估计调用链的根因定位方法及系统,实现提升根因定位效率,降低IT系统的运维成本。
第一方面,本发明提供了一种基于核密度估计调用链的根因定位方法,包括如下步骤:
步骤S10、采集IT系统中,各业务服务的可用性指标以及KPI指标,各调用链上各业务服务之间的响应时间以及成功率指标;
步骤S20、设定一阈值,基于所述阈值对可用性指标进行监测,判断IT系统是否存在故障;
步骤S30、基于核密度估计,将业务服务关联的调用链的所述KPI指标转换为节点异常分数,将业务服务关联的调用链的所述响应时间以及成功率指标转换为节点边异常分数;
步骤S40、将所述节点异常分数以及节点边异常分数加载到IT系统的静态拓扑图,得到故障传播图;
步骤S50、利用随机游走算法对所述故障传播图进行随机游走,定位产生故障的节点以及KPI指标,完成根因定位。
进一步地,所述步骤S10中,所述KPI指标至少包括CPU使用率以及内存使用率。
进一步地,所述步骤S20具体为:
设定一阈值,依次判断各业务服务的可用性指标是否大于所述阈值,若是,说明存在故障,并进入步骤S30;若否,说明不存在故障,继续监测。
进一步地,所述步骤S30具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建新大陆软件工程有限公司,未经福建新大陆软件工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110799721.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的票据OCR识别方法
- 下一篇:一种方便出料的服装染布设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理