[发明专利]故障分析方法、装置、设备及计算机存储介质在审
申请号: | 202111211802.3 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113986659A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 杨平 | 申请(专利权)人: | 湖南天云软件技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/34 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 赵秀芹 |
地址: | 410000 湖南省长沙市岳麓区岳*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障 分析 方法 装置 设备 计算机 存储 介质 | ||
本申请实施例提供了一种故障分析方法、装置、设备及计算机存储介质,该故障分析方法包括获取检测单元中按照时间顺序产生的监控指标数据;基于监控指标数据,计算每个监控指标数据的检测分数;计算检测分数中大于预设指标分数阈值的第一监控指标数据的检测分数的均值;将检测分数的均值与预设单元异常分数阈值进行比对,确定检测分数的均值大于预设单元异常分数阈值的检测单元为故障单元;基于第一监控指标之间的预设因果关系与预设时间顺序关系,确定故障单元的第一监控指标中的目标异常指标。根据本申请实施例,可以通过监控指标数据的检测分数确定故障单元,基于监控指标之间的因果关系,确定目标异常指标,提高了故障分析的时效性与准确性。
技术领域
本申请属于通信技术领域,尤其涉及一种故障分析方法、装置、设备及计算机存储介质。
背景技术
随着互联网技术的发展,应用类型变得越来越复杂多样,尤其在大型数据中心,各类应用运行过程中会出现各种各样的故障,因此,如何从各类应用大量的节点与数据中分析故障发生的原因,成为亟待解决的问题。
现有技术中,主要通过人工基于应用数据对故障进行定位后,有经验的运维人员对故障发生的原因进行分析推断,然而,以上方式对运维人员有一定的技术门槛和经验要求,且存在时效性与准确性较低,费时费力的问题。
发明内容
本申请实施例提供一种故障分析方法、装置、设备及计算机存储介质,能够解决现有技术中故障分析的时效性与准确性较低,费时费力的问题。
第一方面,本申请实施例提供一种故障分析方法,该方法包括:
获取检测单元中按照时间顺序产生的监控指标数据;
基于所述监控指标数据,计算每个监控指标数据的检测分数;其中,所述检测分数表征每个监控指标对应的异常程度;
计算所述检测分数中大于预设指标分数阈值的第一监控指标数据的检测分数的均值;
将所述检测分数的均值与预设单元异常分数阈值进行比对,确定所述检测分数的均值大于所述预设单元异常分数阈值的所述检测单元为故障单元;
基于所述第一监控指标之间的预设因果关系与预设时间顺序关系,确定所述故障单元的所述第一监控指标中的目标异常指标;其中,所述目标异常指标为所述第一监控指标的时间顺序中时间最早的监控指标。
在一种可选的实施方式中,所述基于所述监控指标数据,计算每个监控指标数据的检测分数,包括:
对所述监控指标数据进行平滑处理;
基于第一预设算法模型,计算每个平滑处理后的所述监控指标数据的所述检测分数。
在一种可选的实施方式中,在所述计算所述检测分数中大于预设指标分数阈值的第一监控指标数据的检测分数的均值之前,所述方法还包括:
基于预设故障标记数据,计算所述预设故障标记数据对应的故障单元中所述目标异常指标的所述检测分数的均值;
确定所述均值中的最小值为所述预设单元异常分数阈值。
在一种可选的实施方式中,在所述基于所述第一监控指标之间的预设因果关系与预设时间顺序关系,确定所述故障单元的所述第一监控指标中的目标异常指标之后,所述方法还包括:
显示故障报警信息,所述故障报警信息包括所述目标异常指标。
在一种可选的实施方式中,所述故障报警信息包括故障报警等级;在所述显示故障报警信息之前,所述方法还包括:
基于第二预设算法模型计算所述第一监控指标的异常概率值;
根据所述异常概率值,确定所述目标异常指标对应的所述故障报警等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南天云软件技术有限公司,未经湖南天云软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111211802.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石油过滤设备
- 下一篇:一种科研项目管理系统